Rethinking Visual Prompt Learning as Masked Visual Token Modeling [106.7] マスク付き視覚トークンモデリング(VPTM)として視覚プロンプト学習を提案し、下流の視覚分類を事前訓練されたマスク付き視覚トークン予測に変換する。
VPTMは、生成前訓練された視覚モデルにおける最初の視覚的プロンプト法であり、タスク修正による事前学習と下流視覚分類の整合性を実現する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:44:28 GMT)
Hierarchical Graph Pattern Understanding for Zero-Shot VOS [102.2] 本稿では、ゼロショットビデオオブジェクトセグメンテーション(ZS-VOS)のための新しい階層型グラフニューラルネットワーク(GNN)アーキテクチャを提案する。
構造的関係を捕捉するGNNの強い能力にインスパイアされたHGPUは、運動キュー(すなわち光の流れ)を革新的に活用し、ターゲットフレームの隣人からの高次表現を強化する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:13:21 GMT)
Towards Improving Document Understanding: An Exploration on
Text-Grounding via MLLMs [96.5] 本稿では,画像中のテキストの空間的位置を識別し,MLLMを強化したテキストグラウンド文書理解モデルTGDocを提案する。
我々は,テキスト検出,認識,スポッティングなどの命令チューニングタスクを定式化し,視覚エンコーダと大言語モデルとの密接なアライメントを容易にする。
提案手法は,複数のテキストリッチベンチマークにまたがる最先端性能を実現し,本手法の有効性を検証した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:12:32 GMT)
Faster Diffusion: Rethinking the Role of UNet Encoder in Diffusion
Models [95.5] UNetエンコーダの最初の包括的な研究を行う。
エンコーダの特徴は緩やかに変化するが,デコーダの特徴は時間経過によって大きく変化する。
伝搬方式の利点を生かして,特定の時間ステップでデコーダを並列に実行することが可能となる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:46:43 GMT)
Do LVLMs Understand Charts? Analyzing and Correcting Factual Errors in
Chart Captioning [94.0] 生成したチャートキャプションに事実誤りを包括的に分類する。
大規模な人間のアノテーションの取り組みは、様々なチャートキャプションモデルによって作られたキャプションのエラーパターンと頻度に関する洞察を提供する。
分析の結果,GPT-4Vを含む最先端モデルでさえ,事実不正確なキャプションを頻繁に生成していることが判明した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:16:21 GMT)
Point Transformer V3: Simpler, Faster, Stronger [92.1] 本稿では,ポイントクラウド処理における精度と効率のトレードオフを克服することに焦点を当てる。
本稿では,特定のメカニズムの精度よりもシンプルさと効率を優先するポイントトランスフォーマーV3(PTv3)を提案する。
PTv3は、屋内と屋外の両方のシナリオにまたがる20以上の下流タスクで最先端の結果を得る。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:59:59 GMT)
ColNeRF: Collaboration for Generalizable Sparse Input Neural Radiance
Field [89.5] Collaborative Neural Radiance Fields (ColNeRF) はスパース入力で動作するように設計されている。
ColNeRFはよりリッチでより一般化されたシーン表現をキャプチャできる。
我々のアプローチは、新しい場面に適応するための微調整において優位性を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:03:30 GMT)
Deep Diversity-Enhanced Feature Representation of Hyperspectral Images [87.5] トポロジを改良して3次元畳み込みを補正し,上行階の高次化を図る。
また、要素間の独立性を最大化するために特徴マップに作用する新しい多様性対応正規化(DA-Reg)項を提案する。
提案したRe$3$-ConvSetとDA-Regの優位性を実証するために,様々なHS画像処理および解析タスクに適用する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:26:39 GMT)
A Novel Energy based Model Mechanism for Multi-modal Aspect-Based
Sentiment Analysis [85.8] マルチモーダル感情分析のための新しいフレームワークDQPSAを提案する。
PDQモジュールは、プロンプトをビジュアルクエリと言語クエリの両方として使用し、プロンプト対応の視覚情報を抽出する。
EPEモジュールはエネルギーベースモデルの観点から解析対象の境界ペアリングをモデル化する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:00:27 GMT)
The Art of Balancing: Revolutionizing Mixture of Experts for Maintaining
World Knowledge in Language Model Alignment [85.2] 私たちは、Mixture of Experts(MoE)のプラグインバージョンであるLoRAMoEを紹介します。
LoRAMoEは、トレーニングフェーズ中にバックボーンモデルを凍結することで、世界の知識の完全性を保証する。
また、他の専門家がモデルに格納されている世界の知識を完全に活用することができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:45:06 GMT)
Beyond One-Preference-Fits-All Alignment: Multi-Objective Direct
Preference Optimization [78.5] 我々は、最小限のオーバーヘッドで複数のアライメント目標に対して、MODPO(Multi-Objective Direct Preference Optimization)を提案する。
MODPOは言語モデリングを直接報酬モデリングに折り畳み、全ての目的を特定の重み付けと組み合わせた暗黙的な集団報酬モデル(cRM)としてLMを訓練する。
理論上は MORLHF と同じ最適解を生成することが保証されているが、MODPO は事実上より安定で計算的に効率的である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:58:18 GMT)
Learning Referring Video Object Segmentation from Weak Annotation [78.5] RVOS(Referring Video Object segmentation)は、対象物を記述する文に基づいて、対象物をすべてのビデオフレームにセグメント化することを目的としたタスクである。
そこで本研究では, RVOS に対する十分な監視を提供しながら, アノテーションの労力を 8 倍に削減する新たなアノテーション方式を提案する。
私たちのスキームは、最初にオブジェクトが現れるフレームのマスクと、残りのフレームのバウンディングボックスのみを必要とする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:42:52 GMT)
Label Words are Anchors: An Information Flow Perspective for
Understanding In-Context Learning [77.7] 大規模言語モデル(LLM)の有望な能力としてインコンテキスト学習(ICL)が出現する
本稿では,情報フローレンズを用いたICLの動作機構について検討する。
本稿では,ICL性能向上のためのアンカー再重み付け手法,推論の高速化のための実演圧縮手法,GPT2-XLにおけるICLエラーの診断のための解析フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:48:15 GMT)
GSVA: Generalized Segmentation via Multimodal Large Language Models [76.9] 一般化参照表現(GRES)問題に対処する汎用視覚アシスタント(GSVA)を提案する。
GSVAは[SEG]トークンを再利用し、セグメンテーションモデルを複数のマスク参照を同時にサポートするように促し、革新的にnullターゲットを明示的に拒否する[REJ]トークンを生成することを学習する。
GRES問題の解決におけるGSVAの有効性を検証する実験は、GRESベンチマークgRefCOCOデータセットに注目すべき拡張点と、新たな記録を設定している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:54:31 GMT)
DemoFusion: Democratising High-Resolution Image Generation With No $$$ [75.4] 生成人工知能(GenAI)による高解像度画像生成は大きな可能性を秘めているが、訓練に必要な巨額の資本投資のため、少数の大企業に集中化が進んでいる。
本稿では,ハイレゾ世代のフロンティアを広範に確保しつつ,高レゾリューションなGenAIのフロンティアを前進させることにより,高レゾリューションなGenAIの民主化を目指す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:15:29 GMT)
Toward General-Purpose Robots via Foundation Models: A Survey and
Meta-Analysis [73.9] 既存のロボットシステムは、特定のタスクのために設計され、特定のデータセットに基づいて訓練され、特定の環境にデプロイされている。
ウェブスケールで大規模で大容量の事前学習型モデルの優れたオープンセット性能とコンテンツ生成能力に感銘を受けて,我々は,基礎モデルをロボット工学に適用する方法を探究した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:25:48 GMT)
Robustness May be More Brittle than We Think under Different Degrees of
Distribution Shifts [72.9] 分散シフトの度合いが異なる場合、モデルの堅牢性はかなり不安定で不整合であることを示す。
我々は,CLIPのような大規模事前学習モデルが,新しい下流タスクの分分分布シフトに敏感であることが観察された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:46:00 GMT)
Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.7] Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:53:14 GMT)
Multi-class Support Vector Machine with Maximizing Minimum Margin [67.5] Support Vector Machine (SVM) は、パターン認識タスクに広く応用されている機械学習技術である。
本稿では,クラス損失のペア化と最小マージンの最大化を両立するマルチクラスSVMの新たな手法を提案する。
実験により,提案手法の有効性と優位性を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:50:34 GMT)
PDE+: Enhancing Generalization via PDE with Adaptive Distributional
Diffusion [67.0] ニューラルネットワークの一般化は、機械学習における中心的な課題です。
本稿では、入力データを調整することに集中するのではなく、ニューラルネットワークの基盤機能を直接拡張することを提案する。
私たちはこの理論的フレームワークを、$textbfPDE+$$textbfPDE$ with $textbfA$daptive $textbfD$istributional $textbfD$iffusionとして実践しました。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:46:52 GMT)
Aleth-NeRF: Illumination Adaptive NeRF with Concealing Field Assumption [66.0] 照明効果を考慮した「コンシーリング場」の概念を導入する。
暗黒のシナリオでは、物体の放出は標準的な照明レベルを維持するが、レンダリング中に空気を横切ると減衰する。
評価のために、難解な照明条件下で得られた総合的な多視点データセットを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:49:17 GMT)
Part Representation Learning with Teacher-Student Decoder for Occluded
Person Re-identification [65.6] 本稿では,隠蔽者ReIDのためのTSD(Teacher-Student Decoder)フレームワークを提案する。
提案するTSDは,Parsing-aware Teacher Decoder (PTD) と標準学生デコーダ (SSD) から構成される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:54:48 GMT)
Spatial-Temporal Knowledge-Embedded Transformer for Video Scene Graph
Generation [64.9] 映像シーングラフ生成(VidSGG)は、映像シーン内の物体を特定し、その映像との関係を推測することを目的としている。
因みに、オブジェクトペアとその関係は、各画像内の空間的共起相関と、異なる画像間の時間的一貫性/遷移相関を享受する。
本稿では,従来の空間的時間的知識をマルチヘッド・クロスアテンション機構に組み込んだ時空間的知識埋め込み型トランス (STKET) を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:42:04 GMT)
SeqXGPT: Sentence-Level AI-Generated Text Detection [62.4] 大規模言語モデル(LLM)を用いた文書の合成による文レベル検出の課題について紹介する。
次に,文レベルのAIGT検出機能として,ホワイトボックスLEMのログ確率リストを利用した textbfSequence textbfX (Check) textbfGPT を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:03:16 GMT)
Chat-3D v2: Bridging 3D Scene and Large Language Models with Object
Identifiers [62.2] 会話中にオブジェクトを自由に参照するためにオブジェクト識別子を導入する。
本稿では,属性認識トークンと関係認識トークンを各オブジェクトに対して学習する2段階アライメント手法を提案する。
ScanQA、ScanRefer、Nr3D/Sr3Dといった従来のデータセットで行った実験は、提案手法の有効性を示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:15:33 GMT)
Fine-Grained Image-Text Alignment in Medical Imaging Enables Cyclic
Image-Report Generation [61.6] 本稿では,胸部X線画像領域と医療報告における単語を関連付けるために,適応パッチワードマッチング(AdaMatch)モデルを提案する。
AdaMatchは、適応パッチと単語のきめ細かい関係を利用して、対応する単語で特定の画像領域の説明を提供する。
CXRレポート生成タスクの明示的な説明性を提供するため,循環型CXRレポート生成のためのAdaMatchベースの双方向大言語モデルを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:22:51 GMT)
Optimal Data Selection: An Online Distributed View [61.3] この問題のオンライン版と分散版のアルゴリズムを開発する。
ランダム選択法は, ランダム選択法よりも5~20%高い性能を示した。
ImageNet と MNIST の学習タスクにおいて、我々の選択方法はランダム選択よりも5-20% 高い性能を示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:43:04 GMT)
TF-CLIP: Learning Text-free CLIP for Video-based Person
Re-Identification [60.6] ビデオベースのReIDのための一段階のテキストフリーCLIP学習フレームワークTF-CLIPを提案する。
より具体的には、テキスト機能を置き換えるために、アイデンティティ固有のシーケンス機能をCLIPメモリとして抽出する。
提案手法は,MARS,LS-VID,iLIDS-VIDの他の最先端手法よりも優れた結果を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:10:05 GMT)
VK-G2T: Vision and Context Knowledge enhanced Gloss2Text [60.6] 既存の手話翻訳法は、2段階のパイプラインに従っており、まず手話動画をグロスシーケンス(Sign2Gloss)に変換し、次に生成されたグロスシーケンスを音声言語文(Gross2Text)に変換する。
本稿では,目標文の性質を学習するために手話ビデオの視覚的内容を活用し,文脈知識を活用して単語の適応翻訳を容易にする,視覚的・文脈的知識強化型Gloss2Textモデル VK-G2Tを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:09:34 GMT)
Small Dataset, Big Gains: Enhancing Reinforcement Learning by Offline
Pre-Training with Model Based Augmentation [59.9] オフラインの事前トレーニングは、準最適ポリシーを生成し、オンライン強化学習のパフォーマンスを低下させる可能性がある。
本稿では,オフライン強化学習による事前学習のメリットを最大化し,有効となるために必要なデータの規模を削減するためのモデルベースデータ拡張戦略を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:49:41 GMT)
VadCLIP: Adapting Vision-Language Models for Weakly Supervised Video
Anomaly Detection [58.5] 弱教師付きビデオ異常検出(WSVAD)のための新しいパラダイムであるVadCLIPを提案する。
VadCLIPは、CLIPの強度に関する視覚と言語の間のきめ細かい関連をフル活用している。
本稿では,VadCLIPが粗粒度および細粒度 WSVAD の両面において最高の性能を発揮することを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:42:25 GMT)
Let All be Whitened: Multi-teacher Distillation for Efficient Visual
Retrieval [57.2] 市販の事前学習型検索モデルから軽量な学生モデルに知識を伝達し,効率的な視覚的検索を可能にする多教師蒸留フレームワークWhiten-MTDを提案する。
ソースコードはhttps://github.com/Maryeon/whiten_mtd.comで公開されています。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:43:56 GMT)
GSQA: An End-to-End Model for Generative Spoken Question Answering [57.1] 本稿では,システムに抽象的推論を強制するGSQA(Generative Spoken Question Answering)モデルを提案する。
本モデルでは, 抽出QAデータセットにおいて, 従来の抽出モデルよりも3%上回っている。
我々のGSQAモデルは、幅広い質問に一般化する可能性を示し、それによってさらに音声による質問応答能力を広げる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:33:18 GMT)
OTOv3: Automatic Architecture-Agnostic Neural Network Training and
Compression from Structured Pruning to Erasing Operators [57.1] このトピックは、構造化プルーニングからニューラルアーキテクチャサーチまで、さまざまなテクニックにまたがっている。
第3世代のOTOv3(Noth-Train-Once)を導入する。
我々は,構造化プルーニングとニューラルアーキテクチャ探索におけるOTOv3の有効性を実証した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 00:22:55 GMT)
Toward Deep Drum Source Separation [55.8] 本稿では,独立した単一構造ドラムステムの大規模オーディオデータセットであるStemGMDを紹介する。
合計1224時間、StemGMDはドラムのオーディオデータセットとしてこれまでで最大である。
我々は、StemGMDを利用して、新しいディープドラムソース分離モデルであるLarsNetを開発した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:23:07 GMT)
PulseImpute: A Novel Benchmark Task for Pulsative Physiological Signal
Imputation [54.8] モバイルヘルス(英語: Mobile Health、mHealth)は、ウェアラブルセンサーを使用して、日常生活中の参加者の生理状態を高頻度で監視し、時間的に精度の高い健康介入を可能にする能力である。
豊富な計算文学にもかかわらず、既存の技術は多くのmHealthアプリケーションを構成する脈動信号には効果がない。
このギャップに対処するPulseImputeは、現実的なmHealth欠損モデル、幅広いベースラインセット、臨床関連下流タスクを含む、最初の大規模パルス信号計算チャレンジである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:45:51 GMT)
Understanding Probe Behaviors through Variational Bounds of Mutual
Information [53.5] 情報理論を利用した新しい数学的枠組みを構築することで線形探索のガイドラインを提供する。
まず、プローブ設計を緩和するために、相互情報の変動境界(MI)と探索を結合し、線形探索と微調整を同一視する。
中間表現は、分離性の向上とMIの減少のトレードオフのため、最大のMI推定値を持つことが示される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:38:18 GMT)
Improving Biomedical Entity Linking with Retrieval-enhanced Learning [53.2] $k$NN-BioELは、トレーニングコーパス全体から同様のインスタンスを予測のヒントとして参照する機能を備えたBioELモデルを提供する。
k$NN-BioELは、いくつかのデータセットで最先端のベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:04:23 GMT)
What to Remember: Self-Adaptive Continual Learning for Audio Deepfake
Detection [53.1] 既存の検出モデルは、既知のディープフェイク音声を識別することに成功したが、新しい攻撃タイプに遭遇する際には苦労している。
本稿では,Radian Weight Modification (RWM) と呼ばれる連続的な学習手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:52:17 GMT)
Selective Knowledge Sharing for Privacy-Preserving Federated
Distillation without A Good Teacher [52.3] フェデレーション学習は、ホワイトボックス攻撃に脆弱で、異種クライアントへの適応に苦慮している。
本稿では,選択的FD(Selective-FD)と呼ばれるFDのための選択的知識共有機構を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:21:09 GMT)
Multi-stage Learning for Radar Pulse Activity Segmentation [51.8] 無線信号認識は電子戦において重要な機能である。
電子戦システムでは、レーダパルス活動の正確な識別と位置決めが要求される。
ディープラーニングに基づくレーダーパルス活動認識法は、ほとんど未検討のままである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:56:27 GMT)
Diagnosing and Rectifying Fake OOD Invariance: A Restructured Causal
Approach [51.0] 不変表現学習(IRL)は、不変因果的特徴から環境から切り離されたラベルへの予測を促進する。
最近の理論的結果は、IRLによって回復されたいくつかの因果的特徴は、訓練環境ではドメイン不変のふりをするが、目に見えない領域では失敗する。
本研究では,RS-SCMに関する条件付き相互情報に基づく手法を開発し,その効果を巧みに補正する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:58:05 GMT)
Catwalk: A Unified Language Model Evaluation Framework for Many Datasets [50.8] Catwalkは、既存のNLPデータセットとモデルに統一されたインターフェースを提供する。
キャットウォークは、大規模に制御された実験を行うための障壁を著しく低くする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:11:45 GMT)
Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.6] 我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:27:30 GMT)
Picking the Underused Heads: A Network Pruning Perspective of Attention
Head Selection for Fusing Dialogue Coreference Information [50.4] マルチヘッド自己アテンション機構を持つトランスフォーマーベースのモデルは自然言語処理で広く利用されている。
ネットワークプルーニングの観点から,特徴注入のためのアテンションヘッドの選択と操作戦略について検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:27:24 GMT)
CNC-Net: Self-Supervised Learning for CNC Machining Operations [49.6] 我々は、CNCマシンをシミュレートするためのディープニューラルネットワーク(DNN)の使用を表すCNC-Netという先駆的なアプローチを導入する。
本手法は,手動CNCプログラミングの高コストに代えて,コスト効率のよい代替手段を提供することにより,製造における革新的自動化を実現する可能性を秘めている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:31:17 GMT)
Algorithms for automatic intents extraction and utterances
classification for goal-oriented dialogue systems [49.2] 本稿では,目標指向対話システムのためのスクリプト自動生成フレームワークについて述べる。
BERTopic と Latent Dirichlet の割り当てに基づいてユーザ意図を抽出する2つの方法の比較を行う。
ロジスティック回帰モデルとBERTトランスフォーマーモデルに基づいて,目標指向対話システムのユーザの文を分類するアルゴリズムを2つ実装した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:12:43 GMT)
On the calibration of neural networks for histological slide-level
classification [48.0] 我々は、パッチレベルの特徴表現と、それらの分類性能に関するスライドレベルの予測を組み合わせた3つのニューラルネットワークアーキテクチャを比較した。
我々は、トランスフォーマーが分類性能と校正の点で良い結果をもたらすことを観察する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:46:29 GMT)
ICD-LM: Configuring Vision-Language In-Context Demonstrations by
Language Modeling [48.0] 本稿では,LVLM(Large Vision-Language Model)のための強力なICD(In-Context Demonstration)シーケンスの構成法について述べる。
我々は、効率的なIDDシーケンスを生成するために設計されたICD言語モデル(ICD-LM)を導入する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:11:03 GMT)
Advancing Surgical VQA with Scene Graph Knowledge [47.7] 我々は,シーングラフの知識を用いて,外科的文脈における視覚的質問応答を推し進めることを目指している。
我々は,楽器や解剖の空間的および行動的情報を用いた手術シーングラフを構築した。
軽量Scene-embedded Interaction Module(SIM)を用いた新しい手術用VQAモデルであるSSG-QA-Netを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:50:12 GMT)
Hypergraph-MLP: Learning on Hypergraphs without Message Passing [46.6] 多くのハイパーグラフニューラルネットワークは、ハイパーグラフ構造上のメッセージパッシングを利用してノード表現学習を強化する。
我々は、ハイパーグラフ構造に関する情報を、明示的なメッセージパッシングを伴わずに、トレーニングの監督に組み込む方法を提案する。
具体的には,ハイパーグラフ構造化データのための新しい学習フレームワークであるHypergraph-MLPを紹介する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:30:04 GMT)
Negative Pre-aware for Noisy Cross-modal Matching [46.6] 雑音対応は認識と修正が難しいため,クロスモーダルノイズロバスト学習は難しい課題である。
本稿では,雑音の多い下流タスクに対する大規模視覚言語モデルファインタニングのための,否定的事前認識型クロスモーダルマッチングソリューションを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:18:09 GMT)
A Game-theoretic Framework for Privacy-preserving Federated Learning [46.5] そこで我々は,それぞれの支払額の観点から,守備側と攻撃側の両方を考慮に入れた最初のゲーム理論フレームワークを提案する。
我々はこのゲームをFLPG(Federated Learning Privacy Game)と名付け、ディフェンダーもアタッカーもすべての参加者の報酬を意識していない。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:23:43 GMT)
Multiple Instance Learning for Uplift Modeling [46.2] 昇降モデリングは、プロモーションキャンペーンの効果を推定するために、パフォーマンスマーケティングで広く使われている。
本フレームワークは,各バッグのユーザアップリフト予測をバッグ単位のATE予測として要約し,そのATEラベルに正規化する。
2つのデータセットで行った実験は、提案フレームワークの有効性と普遍性を示している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:28:40 GMT)
Dissolving Is Amplifying: Towards Fine-Grained Anomaly Detection [46.2] 生成拡散モデルは特徴を意識し、特定の方法で医療画像に適用することで、腫瘍や出血などの微細な識別特性を除去または低減することができる。
本稿では,医用画像の意味的に意味のある表現を自己指導的に学習するための,コントラスト学習に基づくテキスト増幅フレームワークを提案する。
DIAは、ベースライン法に対して約18.40%のAUCで医療異常検出性能を著しく改善し、他のベンチマーク法に対して全体的なSOTAを達成する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:53:15 GMT)
MVHuman: Tailoring 2D Diffusion with Multi-view Sampling For Realistic
3D Human Generation [45.9] テキスト誘導から人間の放射界を生成するためのMVHumanという代替スキームを提案する。
我々のコアは、一貫したマルチビュー画像を生成するための事前学習されたネットワークのデノイングプロセスを調整するためのマルチビューサンプリング戦略である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:56:26 GMT)
Phoneme-aware Encoding for Prefix-tree-based Contextual ASR [45.2] Tree-Constrained Pointer Generator (TCPGen)はこの目的を約束している。
音素認識符号化で拡張することで、異常な発音の単語をよりよく認識することを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:37:09 GMT)
SegRap2023: A Benchmark of Organs-at-Risk and Gross Tumor Volume
Segmentation for Radiotherapy Planning of Nasopharyngeal Carcinoma [45.2] 放射線治療にはGross tumor Volumes (GTVs) とOrgans-At-Risk (OARs) が重要である。
SegRap2023チャレンジはMICCAI2023と共同で編成され、OARとGTVセグメンテーションのための大規模なベンチマークが提示された。
課題を詳述し、すべての参加者のソリューションを分析します。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:08:38 GMT)
MarkovGen: Structured Prediction for Efficient Text-to-Image Generation [43.7] マルコフランダム場(MRF)モデルを用いて、画像の異なる領域間の互換性を実現するための軽量なアプローチを提案する。
MRFによる推論は非常に安価で、そのパラメータはバックプロパゲーションによって素早く学習することができる。
私たちのフルモデルであるMarkovGenは、提案したMRFモデルを使用して、Museを1.5倍高速化し、望ましくない画像アーティファクトを減らして高品質な画像を生成する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:16:22 GMT)
Extreme Image Compression using Fine-tuned VQGANs [43.4] 本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:39:13 GMT)
Gradient-based Parameter Selection for Efficient Fine-Tuning [43.4] グラディエントベース。
選択(GPS)はパラメータ効率の良い新しい微調整法である。
GPSはトレーニングと推論の段階で追加のパラメータや計算コストを導入していない。
GPSは3.33%(91.78% vs. 88.45%, FGVC)、9.61%(73.1% vs. 65.57%, VTAB)の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:59:05 GMT)
Federated Inference with Reliable Uncertainty Quantification over
Wireless Channels via Conformal Prediction [43.4] 本研究では,デバイスとサーバが事前学習された機械学習モデルを共有する無線フェデレーション推論シナリオについて検討する。
WFCP(Wireless Federated conformal Prediction)と呼ばれる新しいプロトコルを導入する。
WFCPは、サーバが生成した予測セットのカバレッジに関して、正式な信頼性を保証することが証明されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:30:52 GMT)
Prompt-based Distribution Alignment for Unsupervised Domain Adaptation [42.8] 教師なし学習型視覚言語モデル(VLM)は、ソースドメインとターゲットドメイン間の分布差を著しく低減できることを示す。
このようなモデルを下流のUDAタスクに直接デプロイする上での大きな課題は、迅速なエンジニアリングである。
本稿では,ドメイン知識を素早い学習に組み込むためのPDA手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:15:04 GMT)
IndicIRSuite: Multilingual Dataset and Neural Information Models for
Indian Languages [42.5] 本稿では,11言語を対象にニューラル・インフォメーション・検索リソースを提案する。
これらのリソースには、(a) INDIC-MARCO、MSMARCOデータセットの多言語版であるMSMARCO、(b) Indic-ColBERT、11の異なるモノリンガルニューラルネットワーク検索モデルのコレクションが含まれる。
IndicIRSuiteは、多数のインド言語に対して大規模なニューラル情報検索リソースを構築する最初の試みである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:19:53 GMT)
ChemTime: Rapid and Early Classification for Multivariate Time Series
Classification of Chemical Sensors [42.5] 化学抵抗型センサーアレイは、産業、安全、軍事用途に関連する化学検出タスクにおいて非常に有望である。
化学センシングのためのセンサアレイ分類のための新しいTextitChemTime手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:18:33 GMT)
Toward Computationally Efficient Inverse Reinforcement Learning via
Reward Shaping [42.1] この研究は、各RLサブプロブレムの計算負担を軽減するために、ポテンシャルベースの報酬形成の利用を動機付けている。
本研究は概念実証として機能し,計算効率の高いIRLに向けた今後の発展を期待する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:50:18 GMT)
Phonon-photon conversion as mechanism for cooling and coherence transfer [41.9] 量子場を構成する空洞の可動壁のエネルギーは、場自体の量子に変換できる。
我々は、この現象が壁を冷やすための道具として利用できることを示すために、量子熱力学を用いている。
我々は、他のサブシステムで構成されたケースを含むシステム全体を冷却するために、1つのレーザードライブを使用する方法を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:42:16 GMT)
Advanced Consistency Restoration with Higher-Order Short-Cut Rules [41.9] 我々は、同期中に、より複雑なSC規則をオンザフライで計算する手法を開発した。
これらの高階のSCルールは、複数の変更を1ステップで処理しなければならない場合に、より複雑なシナリオに対処することができます。
評価により、高次SCルールのオンザフライでの計算のオーバーヘッドは許容可能であり、時には全体的な性能も向上することが示された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:33:37 GMT)
Convergent Data-driven Regularizations for CT Reconstruction [41.8] 本研究では,データから線形正則化法を学習する上で,単純だが相変わらず収束するアプローチについて検討する。
このような手法が収束正則化手法となること、およびそれらが提供する再構成が訓練されたトレーニングデータよりも典型的にスムーズであることを証明する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:59:44 GMT)
SAT-Based Algorithms for Regular Graph Pattern Matching [40.9] 複素構造特性をチェックできるグラフ同型を一般化する。
この仕様は正規表現にインスパイアされた特殊なグラフである正規グラフパターン(ReGaP)の形で与えられる。
本稿では、対象グラフが所定のReGaPと一致するかどうかをチェックするSATベースのアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:12:44 GMT)
Deep Event Visual Odometry [40.6] イベントカメラは、高速動作中にカメラのポーズを追跡するエキサイティングな可能性を提供します。
既存のイベントベースのモノクロビジュアルオドメトリーアプローチは、最近のベンチマークで限られたパフォーマンスを示している。
我々は,多数の実世界のベンチマークで高い性能を示す最初の単眼イベントオンリーシステムであるDeep Event VO(DEVO)を紹介する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:00:00 GMT)
CLAF: Contrastive Learning with Augmented Features for Imbalanced
Semi-Supervised Learning [40.5] 半教師付き学習とコントラスト学習は、ポピュラーなアプリケーションでより良いパフォーマンスを達成するために徐々に組み合わせられてきた。
1つの一般的な方法は、擬似ラベルを未ラベルのサンプルに割り当て、擬似ラベルのサンプルから正と負のサンプルを選択して、対照的な学習を適用することである。
比較学習における少数クラスサンプルの不足を軽減するために,CLAF(Contrastive Learning with Augmented Features)を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:27:52 GMT)
Selenite: Scaffolding Online Sensemaking with Comprehensive Overviews
Elicited from Large Language Models [40.1] 本稿では,ユーザの感覚形成過程を飛躍させるための選択肢と基準を包括的に概観する,セレンタイトという新しいシステムを紹介する。
Seniteは、ユーザーが慣れていない情報を体系的かつパーソナライズされた方法で見つけ、読み、ナビゲートするのを助ける。
3つの研究を通して,Seleniteは正確かつ高品質な概要を確実に生成し,ユーザの情報処理を著しく促進し,全体的な理解とセンスメイキング体験を効果的に改善した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:02:23 GMT)
InvertAvatar: Incremental GAN Inversion for Generalized Head Avatars [39.8] 本稿では,複数フレームからの忠実度向上を目的としたアルゴリズムを用いて,アバター復元性能を向上させる新しいフレームワークを提案する。
本アーキテクチャでは,画素対応画像-画像変換を重要視し,観測空間と標準空間の対応を学習する必要性を緩和する。
提案手法は,1ショットと数ショットのアバターアニメーションタスクにおける最先端の性能を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:49:48 GMT)
Debiased Machine Learning and Network Cohesion for Doubly-Robust
Differential Reward Models in Contextual Bandits [39.8] 我々は'DML-TS-NNR'と呼ばれる新しいトンプソンサンプリングアルゴリズムを提案する。
ベースライン報酬を明示的にモデル化することにより、差分報酬パラメータに対する信頼度を小さくする。
実証的な結果によって支持される擬似回帰に関する理論的保証を提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:29:21 GMT)
Forging Tokens for Improved Storage-efficient Training [39.6] SeiTは、Vector-Quantized (VQ)特徴ベクトル(トークン)を視覚分類のためのネットワーク入力として使用することを提案している。
TokenAdaptとColorAdaptを紹介します。
我々は,ストレージ効率の高いImageNet-1k分類,きめ細かい分類,ロバストネスベンチマーク,ADE-20kセマンティックセマンティックセグメンテーションなど,さまざまなシナリオにおけるアプローチを評価した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:11:34 GMT)
Continuum-electron interferometry for enhancement of photoelectron
circular dichroism and measurement of bound, free, and mixed contributions to
chiral response [39.6] レーザー支援極端紫外線電離を用いた光電子干渉法を開発し、ランダムに配向したキラル分子における光電子円二色性の柔軟かつ堅牢な制御を行う。
XUV光子のコムは、XUVイオン化光電子波パケットの成分間の干渉を促進する時間遅延赤外または可視レーザーパルスの存在下でキラル分子のサンプルをイオン化する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:19:24 GMT)
Deep Active Perception for Object Detection using Navigation Proposals [39.5] オブジェクト検出のための汎用的な教師付き能動知覚パイプラインを提案する。
既存のオフ・ザ・シェルフ・オブジェクト・ディテクターを使って訓練でき、シミュレーション環境の進歩も活用できる。
提案手法は, Webots ロボットシミュレータ内に構築された合成データセットを用いて評価した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:55:52 GMT)
Synergistic Multiscale Detail Refinement via Intrinsic Supervision for
Underwater Image Enhancement [39.2] マルチステージを含む水中シーンの細部を高度化するための内在監視(SMDR-IS)を提案する。
ASISFモジュールは、多段劣化段階における特徴伝達を正確に制御し、ガイドすることができる。
Bifocal Intrinsic-Context Attention Module (BICA) は画像中のマルチスケールシーン情報を効率的に活用する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:15:35 GMT)
Test-Time Domain Adaptation by Learning Domain-Aware Batch Normalization [39.1] テストタイムドメイン適応は、ソースドメインでトレーニングされたモデルを、ラベルのないいくつかのイメージを使用して、未表示のターゲットドメインに適応することを目的としている。
従来の作業は通常、ラベルとドメイン間の知識を明示的に分離することなく、ネットワーク全体をナビゲート的に更新する。
本稿では,BN層のみを操作することにより,そのような学習の干渉を低減し,ドメイン知識の学習を高めることを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:22:21 GMT)
3DAxiesPrompts: Unleashing the 3D Spatial Task Capabilities of GPT-4V [39.1] 本稿では,3次元空間タスクにおけるGPT-4Vの能力を解き放つために,3DAxiesPrompts (3DAP) と呼ばれる新しい視覚的プロンプト法を提案する。
3DAP法,すなわち2Dから3Dポイント再構成,2Dから3Dポイントマッチング,3Dオブジェクト検出の3つのタスクを安定的に完了させる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:24:19 GMT)
Chance-Constrained Multiple-Choice Knapsack Problem: Model, Algorithms,
and Applications [39.0] ランダムな重みの確率分布が未知であるがサンプルデータのみが利用可能であるCCMCKPの実践シナリオに注目した。
CCMCKPを解決するために,データ駆動型適応局所探索(DDALS)アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:23:21 GMT)
UMedNeRF: Uncertainty-aware Single View Volumetric Rendering for Medical
Neural Radiance Fields [38.6] 生成した放射場に基づく不確実性を考慮したMedNeRF(UMedNeRF)ネットワークを提案する。
我々は,CTプロジェクションレンダリングの結果を1つのX線で示し,生成した放射場に基づく他の手法との比較を行った。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:58:38 GMT)
Semantic Complete Scene Forecasting from a 4D Dynamic Point Cloud
Sequence [38.4] 本研究では,本研究における意味的完全シーン予測(SCSF)の新たな課題について検討する。
4次元のダイナミックポイントクラウドシーケンスを前提として,将来的な次のフレームに対応するシーンを,セマンティックラベルとともに予測することを目的としている。
SCSFNetと呼ばれる新しいネットワークを通じて,将来予測とセマンティックシーン完了の相乗関係を適切にモデル化する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:03:13 GMT)
Binary Code Summarization: Benchmarking ChatGPT/GPT-4 and Other Large
Language Models [37.9] 本研究では,バイナリコード理解のための大規模言語モデル (LLM) の可能性について検討する。
BinSumは557K以上のバイナリ関数の包括的なベンチマークとデータセットである。
また,従来の完全マッチング手法を超越した意味的類似度尺度を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:32:28 GMT)
Tell Me What You See: Text-Guided Real-World Image Denoising [37.1] 画像キャプション情報の追加は、合成画像と実画像の両方の低照度条件における画像再構成を大幅に改善する。
画像キャプション情報の追加は、合成画像と実画像の両方の低照度条件における画像再構成を大幅に改善することを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:35:07 GMT)
Structural Information Guided Multimodal Pre-training for
Vehicle-centric Perception [36.9] そこで我々は,VagerMAEと呼ばれる新しい車両中心の事前学習フレームワークを提案する。
車両のスケッチラインを空間構造の形式として明示的に抽出し,車両の再建を誘導する。
大規模なデータセットは、約100万の車両画像と12693のテキスト情報を含むAutobot1Mと呼ばれるモデルを事前訓練するために構築されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:10:21 GMT)
Disentangling Linear Mode-Connectivity [36.9] リニアモード接続性(LMC)は、ニューラルネットワークの損失ランドスケープの興味深い特徴の1つである。
LMCは,(1)アーキテクチャ(スパーシティ,ウェイトシェアリング),(2)トレーニング戦略(最適化設定),(3)基礎となるデータセットの3つの要因によってどのように影響を受けるかを検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:38:28 GMT)
Towards Transferable Targeted 3D Adversarial Attack in the Physical
World [36.4] 移動可能な敵攻撃は、セキュリティクリティカルなタスクにより大きな脅威をもたらす可能性がある。
我々は、少数のマルチビュー画像からTransferable Targeted 3Dのテクスチャメッシュに迅速に再構成できるTT3Dという新しいフレームワークを開発した。
実験結果から,TT3Dは優れたクロスモデル転送性を示すだけでなく,異なるレンダリングやビジョンタスクにも適応性を維持することが示唆された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:33:14 GMT)
SkySense: A Multi-Modal Remote Sensing Foundation Model Towards
Universal Interpretation for Earth Observation Imagery [36.2] 本稿では,2150万の時間的シーケンスを持つマルチモーダルリモートセンシングデータセットを事前トレーニングした総称10億スケールモデルSkySenseを提案する。
我々の知る限り、SkySenseは今までで最大のマルチモーダルであり、モジュールを柔軟に組み合わせたり、個別に使用して様々なタスクに適合させることができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:57:21 GMT)
Density Matters: Improved Core-set for Active Domain Adaptive
Segmentation [35.6] セマンティックセグメンテーションにおいて、高価なアノテーションコストとトレーニングされたモデルのパフォーマンスをバランスさせるソリューションとして、アクティブドメイン適応が登場した。
本研究では,古典的コアセット法の理論的境界を再検討し,その性能が選択したサンプルの局所分布と密接な関係があることを確かめる。
動的マスク付き畳み込みを用いた局所的プロキシ推定器を導入し,境界値の最適化のための密度認識グレディアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:22:36 GMT)
SQA-SAM: Segmentation Quality Assessment for Medical Images Utilizing
the Segment Anything Model [35.6] 医用画像セグメンテーションの品質評価の精度を高めるために,SQA-SAMと呼ばれる新しいSQA手法を提案する。
医用画像分割モデル(MedSeg)がテスト画像の予測を生成すると、予測に基づいて視覚的プロンプトを生成し、SAMを用いて視覚的プロンプトに対応するセグメンテーションマップを生成する。
MedSegのセグメンテーションがSAMのセグメンテーションとどのように一致しているかは、MedSegのセグメンテーションがオブジェクトの認識とイメージ領域のパーティションの一般的な認識といかにうまく一致しているかを示している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:49:53 GMT)
Effective and Imperceptible Adversarial Textual Attack via
Multi-objectivization [35.5] 我々はHydraTextが、最近提案された攻撃アプローチよりも、競争力のある攻撃成功率と攻撃非受容性を一貫して達成していることを示す。
人間による評価では、HydraTextによって作られたAEsは人間によるテキストと区別がつかないことが示されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:08:59 GMT)
Improving Cross-domain Few-shot Classification with Multilayer
Perceptron [35.4] クロスドメイン・ショット分類(CDFSC)は、異なるドメインにまたがる大きな分散の相違のため、困難で難しい課題である。
本稿では,識別的一般化の有効性を検証するために,3種類の複数ショット分類手法を取り入れた3つの異なるフレームワークを紹介する。
提案手法は,他の最先端CDFSCアルゴリズムと比較しても良好に比較できる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:54:46 GMT)
Can Physician Judgment Enhance Model Trustworthiness? A Case Study on
Predicting Pathological Lymph Nodes in Rectal Cancer [35.3] 直腸癌リンパ節転移の予測には,臨床データとMRIを用いてトランスフォーマーを用いた。
予測確率分散や定量化合意といったメタレベルの情報を用いてモデルの不確実性を推定した。
この合意が不確実性を減少させるかどうかの私たちの評価は、大きな影響は出なかった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:36:13 GMT)
Progressive Painterly Image Harmonization from Low-level Styles to
High-level Styles [35.2] 絵画的画像調和は、絵の背景にある写真的前景の物体を調和させることを目的としている。
我々は、低レベルなスタイルから高レベルなスタイルに合成前景を調和させるプログレッシブ・マルチステージ調和ネットワークを開発した。
我々のネットワークは、より優れた解釈可能性と調和性能を持っている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:46:03 GMT)
Painterly Image Harmonization by Learning from Painterly Objects [35.2] 美術絵画の絵画的対象に基づいて,背景のスタイルや物体情報から物体のスタイルへのマッピングを学習する。
学習したマッピングにより、エンコーダ特徴写像を調和させて調和した画像を生成するために使用される複合オブジェクトのターゲットスタイルを幻覚することができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:36:44 GMT)
3DGS-Avatar: Animatable Avatars via Deformable 3D Gaussian Splatting [35.0] 3Dガウススプラッティング(3DGS)を用いた単眼ビデオからアニマタブルな人間のアバターを作成する手法を提案する。
我々は、30分以内でトレーニングでき、リアルタイムフレームレート(50以上のFPS)でレンダリングできる非剛性ネットワークを学習する。
実験結果から,本手法は単分子入力によるアニマタブルアバター生成に対する最先端手法と比較して,同等,さらに優れた性能が得られることが示された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:39:07 GMT)
SMILE: Multimodal Dataset for Understanding Laughter in Video with
Language Models [35.0] 我々は、ビデオにおける笑いの背景にある理性を理解するための新しい挑戦に取り組む。
提案するデータセットSMILEは、人々がなぜ笑うのかをビデオクリップと言語記述で記述する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:17:45 GMT)
Mixing predictions for online metric algorithms [34.8] 我々は予測を組み合わせるアルゴリズムを設計し、このような動的組み合わせと競合する。
我々のアルゴリズムは、バンディットのような方法で予測者にアクセスするように適応することができ、一度に1つの予測者しかクエリできない。
我々の下界の1つが予想外の意味を持つのは、$k$-server問題に対する定式化のカバーに関する新しい構造的洞察である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:24:55 GMT)
Representation Learning with Large Language Models for Recommendation [34.5] 本稿では,大規模言語モデル (LLM) を用いた表現学習によるレコメンデータの強化を目的とした,モデルに依存しないフレームワーク RLMRec を提案する。
RLMRecには補助的なテキスト信号が組み込まれており、LLMが権限を持つユーザ/イテムプロファイリングパラダイムを開発し、LLMの意味空間と協調的関係信号の表現空間を整合させる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:11:05 GMT)
TIFace: Improving Facial Reconstruction through Tensorial Radiance
Fields and Implicit Surfaces [34.1] 本報告では,「人間の頭に対するビュー・シンセサイザー・チャレンジ」の第1位を確保したソリューションについて述べる。
人間の頭部の粗い視像を考慮に入れれば、この課題は、新しい視点から画像を合成することである。
テンソル放射場(T-Face)と暗示面(I-Face)による顔再構成を改善するTI-Faceを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:23:20 GMT)
Stochastic interpolants with data-dependent couplings [33.8] 補間剤の枠組みを用いて、ベースとターゲット密度を補間する方法を定式化する。
これらのトランスポートマップは、標準的な独立な設定に類似した単純な2乗損失回帰問題を解くことで学習可能であることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:44:46 GMT)
Customize-It-3D: High-Quality 3D Creation from A Single Image Using
Subject-Specific Knowledge Prior [33.5] 本稿では,参照画像から提供された情報をフル活用して,画像から3D生成に先立ってカスタマイズされた知識を確立する,新しい2段階のアプローチを提案する。
実験では,本手法の優位性であるCustomize-It-3Dが,従来よりも大幅に向上したことを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:07:51 GMT)
Learning in Online Principle-Agent Interactions: The Power of Menus [33.2] オンラインプリンシパルエージェント問題におけるユビキタス学習の課題について検討する。
校長は、エージェントの個人情報を、エージェントが歴史的相互作用において明らかにした好みから学習する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:14:55 GMT)
OEBench: Investigating Open Environment Challenges in Real-World
Relational Data Streams [32.9] 我々はOEBenchという名のオープン環境ベンチマークを開発し、実世界のリレーショナルデータストリームにおけるオープン環境の課題を評価する。
オープン環境のシナリオに適用した場合,データ量の増加はモデル精度を常に向上させるには至らない。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:04:01 GMT)
Greedy Shapley Client Selection for Communication-Efficient Federated
Learning [32.4] フェデレートラーニング(FL)のための標準的なクライアント選択アルゴリズムは、しばしばバイアスがなく、クライアントのランダムサンプリングが一様である。
私たちは、各通信ラウンドで最も貢献するクライアントを特定し、優しく選択する、バイアスのあるクライアント選択戦略であるGreedyFedを開発します。
複数の実世界のデータセット上のさまざまなクライアント選択戦略と比較して、GreedyFedは、タイミング制約の下で高い精度で高速で安定した収束を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:51:43 GMT)
MobileSAMv2: Faster Segment Anything to Everything [32.4] Segment Any Model (SAM) は2つの実用的かつ困難なセグメンテーションタスクに対処する。
SegAnyは画像上のすべてのオブジェクトのマスクを予測し、SegEveryは画像上のすべてのオブジェクトのマスクを予測する。
有効なプロンプトのみを用いて最終マスクを直接生成することで、SegEveryの効率を改善することを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:21:12 GMT)
InstructPipe: Building Visual Programming Pipelines with Human
Instructions [31.8] InstructPipeは、ユーザーがテキスト命令で機械学習パイプライン(ML)のプロトタイピングを開始することができるAIアシスタントである。
InstructPipeは従来の方法に比べてユーザインタラクションを81.1%削減する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:34:53 GMT)
Towards Causal Deep Learning for Vulnerability Detection [31.6] ソフトウェア工学モデルに計算に基づく因果学習を導入する。
以上の結果から,CausalVulはモデル精度,ロバスト性,OOD性能を一貫して改善した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:42:08 GMT)
CGS-Mask: Making Time Series Predictions Intuitive for Al [31.4] 本稿では,CGS-Maskを提案する。
我々はCGS-Maskを合成および実世界のデータセット上で評価し、時間とともに特徴の重要性を解明するために最先端の手法より優れていた。
質問紙調査によるパイロット調査によると,CGS-Maskは容易に理解できる時系列予測結果を示す上で,最も効果的な手法である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:31:21 GMT)
POLTER: Policy Trajectory Ensemble Regularization for Unsupervised
Reinforcement Learning [30.8] 本稿では,任意のURLアルゴリズムに適用可能な事前学習を正規化するためのPOLTERを提案する。
教師なし強化学習ベンチマーク(URLB)におけるPOLTERの評価を行った。
本稿では,データと知識に基づく多種多様なURLアルゴリズムの性能を,平均19%,ベストケースで最大40%向上させることで,このアプローチの汎用性を実証する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:57:01 GMT)
Quilt: Robust Data Segment Selection against Concept Drifts [30.6] 継続的機械学習パイプラインは、モデルが定期的にデータストリームでトレーニングされる産業環境で一般的である。
概念ドリフトは、データXとラベルy、P(X, y)の結合分布が時間とともに変化し、おそらくモデルの精度が低下するデータストリームで発生する。
既存のコンセプトドリフト適応アプローチは、主にモデルを新しいデータに更新することに集中し、ドリフトした履歴データを破棄する傾向がある。
モデル精度を最大化するデータセグメントを識別および選択するためのデータ中心フレームワークであるQultを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:10:34 GMT)
Towards the Unification of Generative and Discriminative Visual
Foundation Model: A Survey [30.5] 視覚基礎モデル(VFM)はコンピュータビジョンの基盤となる発展の触媒となっている。
本稿では,VFMの重要軌道を概説し,その拡張性と生成タスクの熟練性を強調した。
今後のイノベーションの重要な方向は、生成的および差別的パラダイムの融合である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:17:15 GMT)
YUAN 2.0: A Large Language Model with Localized Filtering-based
Attention [29.3] 我々は210億から102.6億までのパラメータを持つ一連の大規模言語モデルであるYuan 2.0を開発しリリースする。
局所フィルタリングに基づく注意(LFA)は、自然言語の局所的な依存関係に関する事前の知識を注意に組み込むために導入された。
YUAN 2.0モデルは、既存のモデルと比較して、コード生成、数学の問題解決、チャットにおいて印象的な能力を示している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:50:33 GMT)
SlowTrack: Increasing the Latency of Camera-based Perception in
Autonomous Driving Using Adversarial Examples [29.2] 我々は、カメラベースのAD知覚の実行時間を増やすために、敵攻撃を生成するフレームワークであるSlowTrackを提案する。
評価の結果,SlowTrackの車両衝突速度は平均95%程度であり,システムレベルの影響は著しく改善できることがわかった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:01:32 GMT)
Implicit Modeling of Non-rigid Objects with Cross-Category Signals [29.0] MODIFは、複数のオブジェクトに対する変形フィールドとインスタンス固有の潜時符号を同時に学習する多目的深い暗黙関数である。
我々は,MODIFが各臓器の形状表現と他臓器との関係を良好に学習できることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:34:17 GMT)
Human Pose Transfer with Augmented Disentangled Feature Consistency [28.7] 人間のポーズ転送を容易にするために,DFC-Net(Disentangled Feature Consistency)を付加したポーズ転送ネットワークを提案する。
ソースとターゲット人を含む一対のイメージが与えられた後、DFC-Netはソースからそれぞれポーズと静的情報を抽出し、ターゲット人のイメージをソースから所望のポーズで合成する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:45:14 GMT)
How Does It Function? Characterizing Long-term Trends in Production
Serverless Workloads [28.5] この記事では、Huaweiのクラウドサーバーレストレースを2つリリースし、分析する。
トレースは7ヶ月以上にわたって、1.4兆以上の関数呼び出しを組み合わせています。
この結果は、サーバレス関数の振る舞いにかなりの多様性があることを示唆している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:43:14 GMT)
Weakly-Supervised 3D Visual Grounding based on Visual Linguistic
Alignment [28.2] 既存の3Dビジュアルグラウンドのアプローチでは、テキストクエリのバウンディングボックスアノテーションがかなり必要になります。
textbfVisual textbfLinguistic textbfAlignment に基づいたtextbf3Dビジュアルグラウンドの弱教師付きアプローチである textbf3D-VLA を提案する。
我々の3D-VLAは、テキストと2D画像間のセマンティクスの整合において、現在の大規模視覚言語モデル(VLM)の優れた能力を利用する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:08:14 GMT)
N-Gram Unsupervised Compoundation and Feature Injection for Better
Symbolic Music Understanding [27.6] 音楽系列は隣接要素間の強い相関関係を示し、自然言語処理(NLP)によるN-gram技術の主要な候補となる。
本稿では,N-gramアプローチを利用したシンボリック・ミュージック・シーケンス理解のための新しい手法NG-Midiformerを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:27:30 GMT)
EDA: Evolving and Distinct Anchors for Multimodal Motion Prediction [27.5] 混合モデルに基づくマルチモーダル動作予測のための正および負の成分を定義するために,EDA(Evolving and Distinct Anchors)と呼ばれる新しいパラダイムを導入する。
EDAにより、アンカーは、拡張された回帰能力のために、特定のシーンで自分自身を進化させ、再分割することができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:55:24 GMT)
No-Skim: Towards Efficiency Robustness Evaluation on Skimming-based
Language Models [27.5] 本研究では,スキー用LLMの所有者が加速スキームのロバスト性を理解し,測定するのを支援するため,No-Skimを提案する。
具体的には,文字レベルおよびトークンレベルにおける最小かつ無意味な摂動を探索し,残りのトークン比を十分に増大させる逆入力を生成する。
最悪の場合、No-Skimが発見した摂動はLLMのランニングコストを平均145%以上増加させる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:42:05 GMT)
Calibrated One Round Federated Learning with Bayesian Inference in the
Predictive Space [27.3] フェデレートラーニング(FL)では、クライアント間で分散されたデータセット上でモデルをトレーニングする。
小さくてノイズの多いデータセットは一般的であり、よく校正されたモデルの必要性を強調している。
予測後部の混合と積を補間するベイズFLアルゴリズムである$beta$-Predictive Bayesを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:17:16 GMT)
From-Ground-To-Objects: Coarse-to-Fine Self-supervised Monocular Depth
Estimation of Dynamic Objects with Ground Contact Prior [27.2] 移動物体の深度推定のための粗大な訓練戦略を提案する。
粗いトレーニング段階では、再投射損失計算から動的クラスのオブジェクトを除外する。
微妙な訓練段階において、再投射損失からオブジェクトの詳細な深さを学習するために、DECネットワークを洗練する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:22:17 GMT)
FoMo-Bench: a multi-modal, multi-scale and multi-task Forest Monitoring
Benchmark for remote sensing foundation models [27.1] 第1回森林モニタリングベンチマーク(FoMo-Bench)について紹介する。
FoMo-Benchは、衛星、航空、在庫データを含む15の多様なデータセットで構成されている。
FoMo-Benchで表されるタスクや地理の多様性をさらに高めるため、我々は新しいグローバルデータセットであるTalloSを紹介した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:49:21 GMT)
Rich Human Feedback for Text-to-Image Generation [27.0] 我々は18K生成画像のリッチなフィードバックを収集し、マルチモーダルトランスフォーマーを訓練して、リッチなフィードバックを自動的に予測する。
例えば、高品質なトレーニングデータを選択して微調整し、生成モデルを改善することで、予測されたリッチな人間のフィードバックを利用して画像生成を改善することができることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:18:38 GMT)
DreamTalk: When Expressive Talking Head Generation Meets Diffusion
Probabilistic Models [26.9] 本研究では,表現力のある発話ヘッドを生成する際の拡散モデルの可能性を解き放つためのDreamTalkフレームワークを提案する。
DreamTalkは、デノベーションネットワーク、スタイル対応のリップエキスパート、スタイル予測器で構成されている。
実験結果から,DreamTalkは多様な発話スタイルで写真リアルな発話顔を生成することができることがわかった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:15:42 GMT)
Semantic-Aware Transformation-Invariant RoI Align [26.8] 2段検出器は1段検出器よりも高い検出精度を持つことが多い。
SRA(Semantic RoI Align)と呼ばれる新しいRoI特徴抽出器を提案する。
SRAは2段検出器の様々な変換の下で不変のRoI特徴を抽出することができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:50:00 GMT)
Neural Meta-Symbolic Reasoning and Learning [26.2] 推論と学習のための最初のニューラルメタシンボリックシステム(NEMESYS)を提案する。
異なるメタプログラミングにより、NEMESYSは自然にいくつかのタスクを推論し、効率的に学習することができる。
実験では,NEMESYSがメタレベルプログラムに適応することで,様々なタスクを解くことができることを示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:19:11 GMT)
Iterative Motion Editing with Natural Language [26.0] 本稿では,既存の文字アニメーションに局所的な編集を反復的に指定するために自然言語を用いる手法を提案する。
我々は、既存の言語を利用して、モーション編集のテキスト記述をモーション編集オペレータのシーケンスに変換するアルゴリズムを提案する。
本システムは,アニメーターの編集意図を尊重し,オリジナルアニメーションに忠実であり,リアルなキャラクターアニメーション結果が得られることを実証する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:38:24 GMT)
Dynamic Gradient Balancing for Enhanced Adversarial Attacks on
Multi-Task Models [25.8] マルチタスク学習(MTL)は、マルチタスクモデルと呼ばれる単一の機械学習モデルを作成し、複数のタスクを同時に実行する。
マルチタスクモデルにはいくつかの重要なセキュリティ研究課題がある。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:49:38 GMT)
PLGSLAM: Progressive Neural Scene Represenation with Local to Global
Bundle Adjustment [25.1] 本研究では,高忠実度表面再構成とロバストなカメラトラッキングをリアルタイムで行うニューラルビジュアルSLAMシステムであるPLGSLAMを提案する。
大規模屋内シーンを扱うため, PLGSLAM では, ローカルシーン表現を動的に割り当てるプログレッシブシーン表現法を提案する。
また,低周波特性,スムーズ性,シーンコンプリートに多層パーセプトロン(MLP)ネットワークを組み込んだ。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:09:30 GMT)
Rethinking Causal Relationships Learning in Graph Neural Networks [24.8] 本稿では,GNNの因果学習能力を高めるために,軽量で適応可能なGNNモジュールを提案する。
提案モジュールの有効性を実証的に検証する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:54:32 GMT)
How Two-Layer Neural Networks Learn, One (Giant) Step at a Time [24.8] 本研究では、2層ニューラルネットワークの特徴がターゲット関数の構造にどのように適応するかを理論的に検討する。
バッチサイズと複数の(しかし、有限個の)ステップの影響を比較する。
我々は、$n = MathcalO(d)$のバッチサイズが、階段の性質を満たす複数の目標方向を学習するのに十分であることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:10:05 GMT)
Plasticine3D: Non-rigid 3D editting with text guidance [24.8] プラスチック3Dは、汎用的で、高忠実で、フォトリアリスティックで、制御可能な非剛性編集パイプラインである。
本研究は, 編集過程を幾何学的編集段階とテクスチャ的編集段階に分割し, より詳細な, フォトリアリスティックな結果を得る。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:01:54 GMT)
On the Expected Size of Conformal Prediction Sets [24.2] 分割共形予測フレームワークを用いて,予測セットの予測サイズを理論的に定量化する。
この正確な定式化は通常直接計算できないので、点推定と高確率境界間隔を導出する。
回帰と分類の両問題に対する実世界のデータセットを用いた実験により,結果の有効性を裏付ける。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:54:39 GMT)
BAT: Behavior-Aware Human-Like Trajectory Prediction for Autonomous
Driving [24.1] 我々は行動認識軌道予測モデル(BAT)を考案した。
我々のモデルは行動認識、相互作用認識、優先度認識、位置認識モジュールから構成される。
次世代シミュレーション(NGSIM)、ハイウェイドローン(HighD)、ラウンドアバウンドドローン(RounD)、マカオコネクテッド自律運転(MoCAD)データセットにおけるBATの性能を評価する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:42:42 GMT)
T-MAE: Temporal Masked Autoencoders for Point Cloud Representation
Learning [24.0] 本稿では,T-MAE(Temporal Masked AutoEncoders)という,時間的隣接フレームを入力とし,時間的依存を学習する効果的な事前学習戦略を提案する。
2フレーム入力には、シームズエンコーダとウィンドウベースのクロスアテンション(WCA)モジュールを含むSiamWCAバックボーンが設定されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:30:49 GMT)
KGLens: A Parameterized Knowledge Graph Solution to Assess What an LLM
Does and Doesn't Know [23.9] 我々は,既存の知識グラフを用いた大規模言語モデル(LLM)の評価手法であるKGLensを紹介する。
KGLensは、より集約されたレベルでその性能を特徴付けるために、構造を意識した方法で、KGから自然言語質問を生成する。
実験では,3つのドメイン固有KGを知識評価のために構築し,19,000のエッジ,700のリレーション,21,000のエンティティからなる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:34:05 GMT)
Adaptive Integration of Partial Label Learning and Negative Learning for
Enhanced Noisy Label Learning [23.8] 我々はtextbfNPN というシンプルながら強力なアイデアを提案し,このアイデアは textbfNoisy ラベル学習に革命をもたらす。
我々はNLの全ての非候補ラベルを用いて信頼性の高い補完ラベルを生成し、間接的な監督を通じてモデルロバスト性を高める。
合成劣化データセットと実世界の雑音データセットの両方で実施された実験は、他のSOTA法と比較してNPNの優位性を示している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:06:19 GMT)
Unraveling Batch Normalization for Realistic Test-Time Adaptation [23.4] 本稿では,ミニバッチ劣化問題について考察する。
バッチ正規化を解き放つことにより、不正確なターゲット統計は、バッチのクラス多様性が大幅に減少することに起因することが判明した。
テスト時間指数移動平均(TEMA)という簡単なツールを導入し、トレーニングとテストバッチ間のクラス多様性のギャップを埋める。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:52:35 GMT)
Mitigating Outlier Activations in Low-Precision Fine-Tuning of Language
Models [23.2] 言語モデルの低精度微調整は、アクティベーションにおける外れ値の存在に影響を受けやすい。
本稿では,低精度整数微調整における外乱アクティベーションの軽減手法について検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:46:53 GMT)
Bimodal Camera Pose Prediction for Endoscopy [23.1] 大腸内視鏡におけるカメラポーズ推定のための合成データセットSimColを提案する。
我々のデータセットは実際の大腸内視鏡の動きを再現し、既存の方法の欠点を強調します。
シミュレーション大腸内視鏡による18kのRGB画像とそれに対応する深度とカメラのポーズを公開し,Unityのデータ生成環境を一般公開した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:08:46 GMT)
Learning Diverse Risk Preferences in Population-based Self-play [23.1] 現在のセルフプレイアルゴリズムはエージェントを最適化し、現在のコピーや歴史的なコピーに対して期待される勝利率を最大化する。
我々は,不確実性に直面したエージェントが多様なリスク嗜好を持つという観点から,多様性を導入する。
本手法は,競技ゲームにおいて,同等あるいは優れた性能を達成可能であることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:06:38 GMT)
ParsNets: A Parsimonious Orthogonal and Low-Rank Linear Networks for
Zero-Shot Learning [22.8] 本稿では,ParsNetsと呼ばれるゼロショット学習(ZSL)において,既存の深層モデルに対して同等あるいはさらに優れた性能を実現するために,並列かつ効率的な設計手法を提案する。
局所線型性の一般化を容易にするため,クラス内サンプルに低ランク制約を課し,クラス間サンプルに高ランク制約を課すことにより,学習特徴量に対する最大マージン幾何学を構築した。
ZSLにおけるモデルの適応性と相反するオーバー/アンダーフィッティングを強化するために、サンプルワイドインジケータのセットを使用して、これらのベース線形ネットワークからスパースサブセットを選択して複合を形成する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:32:11 GMT)
Enhancing the Rationale-Input Alignment for Self-explaining
Rationalization [22.7] DAR(textbfDiscriminatively textbfAligned textbfRationalization)と呼ばれる新しい手法を導入する。
2つの実世界のベンチマーク実験により,提案手法は説明の質を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:04:04 GMT)
Enhancing Cognitive Diagnosis using Un-interacted Exercises: A
Collaboration-aware Mixed Sampling Approach [22.7] 本稿では,CMES(Collaborative-Aware Mixed Exercise Sampling)フレームワークを提案する。
CMESフレームワークは、相互作用のない知識概念と関連付けられた相互作用のない演習に存在する情報を効果的に活用することができる。
また,学生が生成したエクササイズに対する反応を調整するためのランキングベースの擬似フィードバックモジュールを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:44:10 GMT)
Visual Instruction Tuning with Polite Flamingo [22.3] Polite Flamingoは、生のアノテーションをより魅力的な"ポリテ"フォーマットに変換するマルチモーダル応答リライタである。
得られたモデルであるClever Flamingoは、自動的および人的評価に従って、マルチモーダルな理解と応答の丁寧さの両方において、その利点を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:09:58 GMT)
Urban Region Embedding via Multi-View Contrastive Prediction [22.2] さまざまなビューにまたがる一貫性のある表現を学ぶために、新しいパイプラインを構築します。
本モデルは,都市部における表現学習において,最先端のベースライン手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:53:09 GMT)
Do Text Simplification Systems Preserve Meaning? A Human Evaluation via
Reading Comprehension [22.2] 簡単な文章が意味を保っているかどうかを,読解質問を用いて評価するための人的評価フレームワークを提案する。
我々は、人間によるテキストと9つの自動システムによるテキストの徹底的な評価を行う。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:26:06 GMT)
MONET: Modality-Embracing Graph Convolutional Network and Target-Aware
Attention for Multimedia Recommendation [21.6] グラフ畳み込みネットワーク(GCN)を用いたマルチメディアレコメンデータシステムに着目する。
本研究は,商品の嗜好を正確に把握するために,より効果的にマルチモーダル機能を活用することを目的とする。
我々は,モダリティを考慮したGCN(MeGCN)とターゲット認識型アテンションの2つの基本概念からなる,MONETという新しいマルチメディアレコメンデータシステムを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:28:19 GMT)
Extending Context Window of Large Language Models via Semantic
Compression [21.4] 大規模言語モデル(LLM)は、しばしば、流動的で関連する応答の生成を保証するために、テキスト入力の長さに制限を課す。
本稿では,テキストを6~8倍長大に一般化するセマンティック圧縮手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:04:33 GMT)
Non-Exemplar Online Class-incremental Continual Learning via
Dual-prototype Self-augment and Refinement [21.3] オンライン授業増分継続学習(NO-CL)は,新しい,実践的,挑戦的な問題である。
データ例をバッファリングすることなく、ベースクラスの識別性を保ち、シングルパスのデータストリームで新しいクラスを継続的に学習することを目的としている。
本研究では,NO-CL問題に対する新しいDSR法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:12:03 GMT)
How to Use Large Language Models for Text Coding: The Case of Fatherhood
Roles in Public Policy Documents [21.1] 大規模言語モデル(LLM)は、政治科学におけるテキスト分析の新しい機会を開いた。
本研究では,非英語政治科学テキストの3つの元の符号化課題についてLLMを評価した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:18:48 GMT)
Large Scale Foundation Models for Intelligent Manufacturing
Applications: A Survey [21.1] この論文は、LSFMの現在の像とその利点を知的製造の文脈で体系的に説明した。
実世界の知的製造シナリオにおけるLSFMの応用事例を提示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:55:19 GMT)
RJUA-QA: A Comprehensive QA Dataset for Urology [20.7] RJUA-QAは、質問応答(QA)と臨床証拠の推論のための新しい医療データセットである。
このデータセットには2,132種類の質問-文脈-回答ペアが含まれており、約25,000の診断記録と臨床ケースに対応している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:40:25 GMT)
Riveter: Measuring Power and Social Dynamics Between Entities [20.7] Riveterはテキストコーパスのエンティティに関連する動詞の意味を分析するための完全なパイプラインを提供する。
このパッケージには感情、力、エージェンシーといった意味の枠組みが組み込まれており、社会現象を捉えるのに有用であることが示されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:03:24 GMT)
TMP: Temporal Motion Propagation for Online Video Super-Resolution [20.6] オンラインビデオ超解像(オンラインVSR)は、時間情報を集約するための効果的なアライメントモジュールに依存している。
既存のオンラインVSR手法の多くは、各フレームの運動場を別々に推定してアライメントを行う。
本稿では,高速な画素レベルのアライメントを実現するために,運動場の連続性を利用した効率的な時間運動伝搬法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:17:34 GMT)
Multi-frame-based Cross-domain Denoising for Low-dose Spiral Computed
Tomography [20.5] X線被曝は、がんなどの潜在的な健康リスクへの懸念を引き起こす。
放射線線量を減らすという欲求は、研究者に再建の質の向上を促した。
本稿では,市販の第3世代マルチスライス・スパイラルCTスキャナの2段階化手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:49:49 GMT)
Context-I2W: Mapping Images to Context-dependent Words for Accurate
Zero-Shot Composed Image Retrieval [19.9] Composed Image Retrieval (ZS-CIR)は、幅広い視覚コンテンツ操作意図を持つ多様なタスクを含む。
本稿では,記述関連画像情報を擬似語トークンに適応的に変換するコンテキスト依存型マッピングネットワークであるContext-I2Wを提案する。
本モデルは、ドメイン変換、オブジェクト合成、オブジェクト操作、属性操作を含む、4つのZS-CIRタスクに対して強力な一般化能力を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:32:37 GMT)
Attention-Based VR Facial Animation with Visual Mouth Camera Guidance
for Immersive Telepresence Avatars [19.7] 本稿では,マウスカメラのキーポイントと直接視覚誘導を併用したハイブリッド手法を提案する。
提案手法は,未知の演算子に一般化され,短いビデオ2本をキャプチャして簡単なエンロラメントステップのみを必要とする。
我々は、ANAアバターXPRIZEファイナルでの勝利に顔のアニメーションがどう貢献したかを強調した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:45:11 GMT)
Marathon: A Race Through the Realm of Long Context with Large Language
Models [19.5] 我々はMMLUなどのベンチマークにインスパイアされた新しい長期文脈評価ベンチマークを開発した。
我々は、最新かつ最もポピュラーな大規模言語モデルと、3つの最新かつ効果的な長期文脈最適化手法を評価した。
これは、これらの大きな言語モデルの長いコンテキスト推論と理解能力を示し、これらの最適化手法の有効性を検証する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:30:14 GMT)
S2WAT: Image Style Transfer via Hierarchical Vision Transformer using
Strips Window Attention [19.4] 本稿では,スタイル転送用に設計された新しい階層型視覚変換器であるStrips Window Attention Transformer (S2WAT)を紹介する。
S2WATは、ショートレンジとロングレンジの両方の依存関係をキャプチャするために、様々なウィンドウ形状の注意計算を使用する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:21:56 GMT)
VidEdit: Zero-Shot and Spatially Aware Text-Driven Video Editing [19.2] 本稿では,ゼロショットテキストベースのビデオ編集手法であるVidEditを紹介する。
本研究では,アトラスベースと事前学習したテキストと画像の拡散モデルを組み合わせて,学習不要で効率的な編集方法を提案する。
実験により、VidEditはDAVISデータセット上で最先端のメソッドより優れていることが示された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:54:57 GMT)
A Novel Hybrid Ordinal Learning Model with Health Care Application [19.1] 正規学習(英: Ordinal Learning, OL)は、医療分野において幅広い用途を持つ機械学習モデルの一種である。
本稿では,コストや可用性の制約により,正確なラベル付きサンプルがトレーニングセットに制限されている状況に対処することを目的とする。
そこで本研究では,サンプルを正確なラベルと間隔ラベルの両方と統合し,頑健なOLモデルをトレーニングするためのHOL(Hybrid Ordinal Learner)を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:22:39 GMT)
Data-Efficient Multimodal Fusion on a Single GPU [19.0] FuseMix は任意の訓練済みの単調エンコーダの潜時空間で動作するスキームである。
本稿では,事前学習したテキストから画像への生成モデルを音声から画像へ変換する手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:00:07 GMT)
Disorder-tunable entanglement at infinite temperature [18.9] 我々はエネルギースペクトルの中央に豊富な絡み合い構造を持つ非熱化状態の新しいパラダイムを開発する。
我々のアプローチは、最近提案された「レインボー傷」と呼ばれる非エルゴード的行動を利用したものである。
熱化を阻害するエキゾチックな多体状態を設計するためのノブを提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:30:38 GMT)
AnyText: Multilingual Visual Text Generation And Editing [18.8] 拡散型多言語視覚テキスト生成・編集モデルであるAnyTextを紹介する。
AnyTextは複数の言語で文字を書くことができます。
我々は、OCRアノテーションと300万の画像テキストペアを複数言語で含む、最初の大規模多言語テキスト画像データセットであるAnyWord-3Mをコントリビュートする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:51:01 GMT)
Combinatorial Complexes: Bridging the Gap Between Cell Complexes and
Hypergraphs [18.8] ハイパーグラフとセルコンプレックスは,アプリケーションコンテキストによって異なる実用性を持つような,多彩な関係性を重視している,と我々は主張する。
これら2つの選択の相対的な利点について論じ、既存の集合型および階層的関係の共存を可能にする複素体の概念について詳述する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:04:28 GMT)
CARAT: Contrastive Feature Reconstruction and Aggregation for
Multi-modal Multi-label Emotion Recognition [18.8] マルチモーダルマルチラベル感情認識(MMER)は、複数のモーダルから関連する感情を識別することを目的としている。
MMERの課題は、異種データから複数のラベルの識別機能を効果的に取得する方法である。
本稿では,MMERタスクのためのContrAstive Feature Restruction and AggregaTion(CARAT)を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:58:05 GMT)
LogoStyleFool: Vitiating Video Recognition Systems via Logo Style
Transfer [18.2] クリーンビデオにスタイリングされたロゴを追加することで,LogoStyleFoolという新しい攻撃フレームワークを提案する。
攻撃は、スタイル参照選択、強化学習に基づくロゴスタイル転送、摂動最適化の3段階に分けられる。
実験結果は、攻撃性能とセマンティック保存の観点から、3つの最先端のパッチベースの攻撃に対して、LogoStyleFoolの全体的な優位性を裏付けるものである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:44:38 GMT)
Exploring Adversarial Robustness of Vision Transformers in the Spectral
Perspective [17.9] Vision Transformerは画像分類タスクの強力なツールとして登場し、畳み込みニューラルネットワーク(CNN)の性能を上回っている。
本稿では,スペクトル領域における周波数選択摂動に対する変換器の対角的堅牢性について検討する。
実験の結果、Transformerは位相情報や低周波情報に依存しており、CNNよりも周波数選択攻撃に弱いことが判明した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:41:43 GMT)
Refining ChatGPT-Generated Code: Characterizing and Mitigating Code
Quality Issues [17.8] 我々は2つの人気のあるプログラミング言語で実装された4,066個のChatGPT生成コードの品質を体系的に研究した。
本稿では,ChatGPT生成コードの品質に関する潜在的な問題を同定し,特徴付ける。
ChatGPTはこれらの課題に部分的に対処でき、コード品質を20%以上改善していますが、まだ改善の余地と機会があります。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:17:35 GMT)
Distilling Multi-Level X-vector Knowledge for Small-footprint Speaker
Verification [17.5] 本研究は, 知識蒸留を用いた小型フットプリント深層話者埋込み抽出の開発に焦点をあてる。
我々のアプローチは、x-vectorモデル(教師ネットワーク)の異なるレベルからの埋め込みをマージして、コンパクトな学生ネットワークを訓練することである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:37:19 GMT)
Coupling Fairness and Pruning in a Single Run: a Bi-level Optimization
Perspective [17.4] 本研究では, プルーニングマスクと重み更新処理を公平性制約で協調的に最適化する枠組みを提案する。
このフレームワークは、単一実行時の公平性を確保しながら、パフォーマンスを維持するモデルを圧縮するように設計されている。
我々の経験的分析は、我々のフレームワークといくつかの主流プルーニング戦略を対比し、モデルフェアネス、パフォーマンス、効率の維持における我々の方法の優位性を強調している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:08:53 GMT)
Peer Learning: Learning Complex Policies in Groups from Scratch via
Action Recommendations [17.2] ピアラーニングは、グループで学ぶエージェントのための新しい高度な強化学習フレームワークである。
ピアラーニングは,OpenAI Gymドメインのいくつかの課題において,単一エージェント学習とベースラインを上回り得ることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:01:35 GMT)
Unsupervised Social Event Detection via Hybrid Graph Contrastive
Learning and Reinforced Incremental Clustering [17.1] 本稿では,ハイブリッドグラフのコントラスト学習と漸進的クラスタリングによるソーシャルメディアイベント検出手法を提案する。
TwitterとMavenのデータセット上でHCRCを評価するための包括的な実験を行います。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:41:15 GMT)
Machine Learning for Health symposium 2023 -- Findings track [16.7] ML4H 2023は、様々な健康関連分野における問題に関する高品質な申請を招待した。
紙は、高度な技術的洗練と健康への影響の高い成熟した仕事をターゲットにしていた。
Findingsのトラックは、洞察に富んだ議論を引き起こしたり、コミュニティにとって価値のあるリソースとして機能したり、新しいコラボレーションを可能にする可能性のある新しいアイデアを探していた。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:10:35 GMT)
Exploiting Library Vulnerability via Migration Based Automating Test
Generation [16.4] ソフトウェア開発において、開発者は既存の機能を実装するのを避けるためにサードパーティのライブラリを幅広く利用する。
脆弱性のエクスプロイトは、公開後に脆弱性を再現するためのコードスニペットとして、豊富な脆弱性関連情報を含んでいる。
本研究は、開発者が依存関係を更新するかどうかを判断する基盤として脆弱性エクスプロイトテストを提供するVESTAと呼ばれる、脆弱性エクスプロイトに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:46:45 GMT)
GreenFlow: A Computation Allocation Framework for Building
Environmentally Sound Recommendation System [16.3] 毎秒数十万のリクエストがある現実のシナリオでは、各リクエストに対してパーソナライズされた結果を推測するために、重要な計算が必要である。
提案するグリーンフローは, 推定における精度と二酸化炭素排出量の両立を考慮した, 実用的なアロケーションフレームワークである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:26:07 GMT)
ProSGNeRF: Progressive Dynamic Neural Scene Graph with Frequency
Modulated Auto-Encoder in Urban Scenes [16.0] 暗黙の神経表現は、大規模で複雑なシーンのビュー合成において有望な結果を示している。
既存のアプローチでは、素早く動くオブジェクトをキャプチャできないか、カメラのエゴモーションなしでシーングラフを構築する必要がある。
本研究では,大規模都市景観と高速移動車両の視点合成問題を共同で解決することを目的とする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:11:28 GMT)
Where2Explore: Few-shot Affordance Learning for Unseen Novel Categories
of Articulated Objects [16.0] Where2Explore"は、限られた数のインスタンスで最小限のインタラクションを持つ新しいカテゴリを効果的に探求するフレームワークである。
本フレームワークは, 異なるカテゴリ間の幾何学的類似性を明示的に推定し, 効率的な探索のための訓練カテゴリの形状と異なる局所領域を同定する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:36:46 GMT)
Tracking Skiers from the Top to the Bottom [15.9] SkiTBはスキーにおけるコンピュータビジョンのための最大かつ最も注釈付きのデータセットである。
確立された手法と新たに導入されたスキーヤー最適化ベースラインアルゴリズムの両方を含む、いくつかのビジュアルオブジェクト追跡アルゴリズムをテストする。
その結果、視覚に基づくスキー分析における異なるトラッキング手法の適用性に関する貴重な知見が得られた。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:53:17 GMT)
Challenges with unsupervised LLM knowledge discovery [15.8] 大規模言語モデル(LLM)アクティベーションにおける既存の教師なし手法が知識を発見できないことを示す。
教師なしの知識推論の背景にある考え方は、知識は、知識を発見するのに使用できる一貫性構造を満たすというものである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:49:43 GMT)
Towards Architecture-Insensitive Untrained Network Priors for
Accelerated MRI Reconstruction [15.8] 未トレーニングのニューラルネットワークは、トレーニングのために完全にサンプリングされた測定を必要とせずに、MRIの再構築を可能にした。
特定のアーキテクチャコンポーネントは、パラメータの数に関係なく過度に適合する傾向にあることを観察する。
本稿では,ホワイトノイズ入力の周波数範囲を制約する手法と,ネットワークのリプシッツ定数をペナルティ化する手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:01:47 GMT)
C-Pack: Packaged Resources To Advance General Chinese Embedding [15.7] C-Packは、一般的な中国の埋め込みの分野を著しく前進させるリソースのパッケージである。
C-MTEBは6つのタスクと35のデータセットをカバーする中国のテキスト埋め込みのベンチマークである。
C-MTPは、埋め込みモデルをトレーニングするためのラベル付きおよびラベルなしの中国語コーパスからキュレートされた巨大なテキスト埋め込みデータセットである。
C-TEMは、複数のサイズをカバーする埋め込みモデルのファミリーである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:18:11 GMT)
Osprey: Pixel Understanding with Visual Instruction Tuning [15.7] Ospreyは、細かいマスク領域を言語命令に組み込むことでMLLMを拡張するマスクテキスト命令チューニング手法である。
この目的を達成するために、まず724Kサンプルを用いてマスクベースの領域テキストデータセットをキュレートし、次いでLLMにピクセルレベルの表現を注入して視覚言語モデルを設計する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:58:11 GMT)
Localization with Reconfigurable Intelligent Surface: An Active Sensing
Approach [15.7] 本稿では,パイロットを順次送信し,基地局が検知ベクトルを適応的に調整する戦略を提案する。
提案手法は解釈可能な結果を生成し, 知覚段階の数で一般化可能である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:36:16 GMT)
Fine-tuning vision foundation model for crack segmentation in civil
infrastructures [15.6] セグメンテーションにおける基礎モデルを微調整するために、微調整法が採用される:セグメンション・アシング・モデル(SAM)
CrackSAMは、特に薄暗い照明、影、道路標識、建設継手、その他の干渉要因などの困難な条件下で、顕著な優位性を示す。
これらのクロスシナリオの結果は、基礎モデルの卓越したゼロショット能力を示し、土木工学におけるビジョンモデルを開発するための新しいアイデアを提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:50:55 GMT)
Transport response of topological hinge modes in $\alpha$-Bi$_4$Br$_4$ [15.6] 断熱バルクおよび表面エネルギーギャップ内に存在する空隙のない位相ヒンジ状態における量子輸送の最初の証拠を示す。
本研究は, トポロジ的特性と量子コヒーレンスを兼ね備えたトポロジ的ヒンジモードの量子輸送応答を総合的に明らかにした。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:52:55 GMT)
Embodied Adversarial Attack: A Dynamic Robust Physical Attack in
Autonomous Driving [15.4] Embodied Adversarial Attack (EAA) は、インボディード・インテリジェンス(英語版)のパラダイムである知覚-決定-制御(英語版)を採用することを目的としている。
EAAは、物理的攻撃を実施するために、レーザーを高度に操作可能な媒体として採用し、さらに強化学習で攻撃エージェントを訓練し、最良の攻撃戦略を瞬時に決定できるようにする。
複雑な環境下での手法の有効性を検証した実験は多種多様である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:16:17 GMT)
Pixel-Superpixel Contrastive Learning and Pseudo-Label Correction for
Hyperspectral Image Clustering [15.4] 既存のピクセルレベルと超ピクセルレベルのHSIクラスタリングタスクでは,コントラスト学習手法が優れている。
超画素レベルのコントラスト学習法は,HSIの均一性を生かし,演算資源を削減する。
本稿では,画素とスーパーピクセルのクラスタリングの擬似ラベルを整列する擬似ラベル補正モジュールを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:19:00 GMT)
Style Generation in Robot Calligraphy with Deep Generative Adversarial
Networks [15.2] 漢字の数は数万であり、6000文字を超える一貫した漢字フォントの生成が困難になる。
本稿では,プロの規格で書体を生成可能な,深層生成逆数ネットワーク(deepGAN)に基づく自動書体生成モデルを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:35:30 GMT)
Unsupervised Neighborhood Propagation Kernel Layers for Semi-supervised
Node Classification [15.2] グラフにおける半教師付きノード分類のためのディープグラフ畳み込みカーネルマシン(GCKM)を提案する。
ワンホップ地区におけるノードの特徴を伝播するカーネルマシン層を導入する。
我々は、Fenchel-Young不等式のレンズを通して、半教師付き分類カーネルマシンを指定する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:11:46 GMT)
The Complexity of Optimizing Atomic Congestion [14.8] アトミック・渋滞ゲームは、ネットワーク設計、ルーティング、アルゴリズムゲーム理論において古典的なトピックである。
非常に単純なネットワークでも問題は非常に難解なままである。
我々は、この問題の(さらに難しい)min-max変種に対する分析を拡張して結論付ける。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:31:30 GMT)
3D-MuPPET: 3D Multi-Pigeon Pose Estimation and Tracking [14.5] 複数のカメラビューを用いて対話的な速度で最大10羽のハトの3Dポーズを推定・追跡するフレームワークである3D-MuPPETを提案する。
まず第1フレームのグローバルIDに2D検出を動的にマッチングし、次に2Dトラッカーを使用して、その後のフレームにおけるビュー間のIDを維持する。
また、3D-MuPPETは自然環境からのアノテーションを伴わずに屋外でも機能することを示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:40:00 GMT)
Movement Primitive Diffusion: Learning Gentle Robotic Manipulation of
Deformable Objects [14.4] ロボット支援手術(RAS)における新しい模倣学習法である運動原始拡散(MPD)を紹介する。
MPDは、RASアプリケーションにとって重要なデータ効率を維持しながら、変形可能なオブジェクトの穏やかな操作を実現する。
我々は,様々なシミュレートされたタスクにまたがってMPDを評価し,状態と画像の両方で実世界におけるロボットのセットアップを評価する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:24:28 GMT)
FuXi-S2S: An accurate machine learning model for global subseasonal
forecasts [14.3] FuXi Subseasonal-to-Seasonal (FuXi-S2S)は、機械学習に基づくサブシーズン予測モデルである。
FuXi-S2Sは、拡張されたFuXiベースモデルと、隠れた特徴のフロー依存摂動のための摂動モジュールを統合している。
年間平均気温は最大42日で、13の圧力レベルと11の地表変数で5つの上層大気変数をカバーしている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:31:44 GMT)
Collaborating Foundation models for Domain Generalized Semantic
Segmentation [14.1] ドメイン一般化セマンティック(DGSS)は、ラベル付きソースドメイン上でモデルをトレーニングする。
我々はDGSSにアプローチし、CLOUDS(Domain Generalized Semantic)のためのCoLlaborative FOUndationモデルの組立を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:43:24 GMT)
Very high resolution canopy height maps from RGB imagery using
self-supervised vision transformer and convolutional decoder trained on
Aerial Lidar [14.1] 本稿では,複数の非国家の管轄区域で同時に作成される最初の高分解能天蓋の高さマップについて述べる。
地図は、2017年から2020年にかけて、マクサー画像に基づいて訓練された自己教師モデルから特徴を抽出することによって生成される。
また、GEDI観測に基づいて訓練された畳み込みネットワークを用いた後処理のステップも導入する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:28:21 GMT)
Focus on Your Instruction: Fine-grained and Multi-instruction Image
Editing by Attention Modulation [14.0] Focus on Your Instruction (FoI) は、余分なトレーニングやテストタイムの最適化なしに複数の命令をまたいだ正確かつ調和した編集を保証するために設計された手法である。
最初の目的として,命令と画像の交差位置からIP2Pの暗黙的な接地能力を特定し,効果的なマスク抽出法を開発した。
第2の目的として、ターゲット編集領域と非関連領域を大まかに分離するクロスアテンション変調モジュールを導入する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:10:35 GMT)
Open quantum system in the indefinite environment [14.0] 本稿では,オープン量子系の干渉工学について考察する。
環境は、干渉計の使用または補助量子ビットの導入によって不確定にされる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:50:23 GMT)
SLS4D: Sparse Latent Space for 4D Novel View Synthesis [13.7] 既存の動的NeRFは通常、変形場に合うように局所的な密度の格子を利用する。
4次元空間は本質的にスパースである。
学習可能なスパース潜在空間(SLS4D)を用いて4次元シーンを表現することを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:31:20 GMT)
Red AI? Inconsistent Responses from GPT3.5 Models on Political Issues in
the US and China [13.6] 本稿では,GPTの多言語モデルにおける政治的バイアスについて検討する。
我々は、米国と中国の政治問題に関して、英語と簡体字の両方でGPTに同じ疑問を提起した。
両言語対応の分析の結果,GPTの政治的「知識」と政治的「態度」が中国の政治問題に大きく矛盾していることが判明した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:25:56 GMT)
Gene-MOE: A Sparsely-gated Framework for Pan-Cancer Genomic Analysis [13.6] そこで本研究では, RNA-seq解析フレームワークであるGene-MOEについて紹介する。
Gene-MOEは、分析精度を高めるために、MOE層とアテンションエキスパート層の混合物のポテンシャルを利用する。
事前訓練を通じて33種類のがんからパンがん情報を統合することで、過度に適合する課題に対処する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:19:23 GMT)
FlowMur: A Stealthy and Practical Audio Backdoor Attack with Limited
Knowledge [13.4] FlowMurはステルスで実用的なオーディオバックドア攻撃で、限られた知識で起動できる。
2つのデータセットで実施された実験は、FlowMurがデジタルと物理の両方で高い攻撃性能を達成することを示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:26:18 GMT)
WordScape: a Pipeline to extract multilingual, visually rich Documents
with Layout Annotations from Web Crawl Data [13.3] 本稿では,学際的,多言語的コーパス作成のための新しいパイプラインであるWordScapeを紹介する。
WordScapeはWebから取得したWordドキュメントのオープンXML構造を解析する。
文化的にも言語的にも多様なドキュメントページを提供し、自然な意味構造と高品質なテキストを提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:28:31 GMT)
PELP: Pioneer Event Log Prediction Using Sequence-to-Sequence Neural
Networks [13.2] 本稿では,シークエンス・ツー・シークエンス・ディープ・ラーニング・アプローチを用いたイベントログ予測問題の解法を提案する。
種々の合成ログと7つの実生活ログの予測結果の評価と解析を行った。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:30:30 GMT)
Robustness Verification of Deep Reinforcement Learning Based Control
Systems using Reward Martingales [13.1] 本稿では,DRLに基づく制御システムのロバスト性検証のための報奨マーチンガレットの導入による最初のアプローチを提案する。
本結果は,2つの質問に対する有意な定量的証明を提供する。
次に、さまざまな種類の制御ポリシに対して、ニューラルネットワークを介して報酬マーチンガレットを実装およびトレーニングできることを示します。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:16:47 GMT)
RANRAC: Robust Neural Scene Representations via Random Ray Consensus [13.0] 本稿では,3次元物体を隠蔽・散逸した画像を扱う頑健な再構成アルゴリズムRANRACを紹介する。
本ソリューションは,光フィールドネットワークによる単一ショット再構成を支援する。
本研究は,8dBPSNRをベースラインと比較し,包括的シナリオにおける新規ビュー合成の大幅な改善を報告した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:33:09 GMT)
AEGIS-Net: Attention-guided Multi-Level Feature Aggregation for Indoor
Place Recognition [12.7] AEGIS-Netは、RGBの点雲を取り込み、グローバルな位置記述子を生成する新しい屋内位置認識モデルである。
AEGIS-Netはセマンティックエンコーダ、セマンティックデコーダ、アテンション誘導機能埋め込みで構成されています。
我々は,ScanNetPRデータセット上でAIGIS-Netを評価し,その性能を事前学習機能ベース手法と5つの最先端ディープラーニングベース手法と比較した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:09:08 GMT)
When Contracts Meets Crypto: Exploring Developers' Struggles with
Ethereum Cryptographic APIs [12.7] この研究は、暗号の実践に関する最初の実証的研究である。
91,484,856トランザクション、500の暗号関連契約、483のStackExchangeポストを分析して、開発者が遭遇する障害の5つのカテゴリを特定した。
実践者の半数以上が、スマートコントラクトの一般的なビジネスロジックと比較して、暗号処理の課題に直面しています。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:58:53 GMT)
TAB: Text-Align Anomaly Backbone Model for Industrial Inspection Tasks [12.7] 本稿では,製造領域に適したバックボーンモデルを十分に訓練するための新しい枠組みを提案する。
本手法では,正常な状態と異常な状態に対する視覚的,テキスト的に整列した埋め込み空間を同時に検討する。
その結果、事前訓練されたバックボーンは、工業的な下流タスクのパフォーマンスを著しく向上させる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:37:29 GMT)
Streaming Active Learning for Regression Problems Using Regression via
Classification [12.6] 本稿では,回帰学習のためのストリーミング能動学習にレグレッション・ウィズ・クラス化フレームワークを用いることを提案する。
レグレッション・ウィズ・クラス化は回帰問題を分類問題に変換し、ストリーミング能動学習法を回帰問題に直接適用できるようにする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:01:41 GMT)
Synthetic optical coherence tomography angiographs for detailed retinal
vessel segmentation without human annotations [12.6] 本稿では,より高速でリアルなOCTA合成のために,空間コロニー化に基づく網膜血管網の軽量なシミュレーションを行う。
本研究では,3つの公開データセットに対する定量的および定性的実験において,提案手法の優れたセグメンテーション性能を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:37:03 GMT)
Multi-Source Domain Adaptation for Object Detection with Prototype-based
Mean-teacher [12.5] 視覚オブジェクト検出器を操作対象領域に適応させることは難しい課題であり、一般には教師なし領域適応(UDA)法を用いて達成される。
近年の研究では、ラベル付きデータセットが複数のソースドメインから来ると、それらを別々のドメインとして扱うことで、これらのソースドメインをブレンドしてUDAを実行するよりも正確性と堅牢性を向上させることが示されている。
本稿では,ドメイン特化情報の代わりにクラスプロトタイプを用いてドメイン特化情報をエンコードする,プロトタイプベース平均教師(PMT)と呼ばれる新しいMSDA手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:00:50 GMT)
UniAR: Unifying Human Attention and Response Prediction on Visual
Content [12.3] UniAR - 異なるタイプの視覚コンテンツにわたって暗黙的および明示的な人間の振る舞いを予測する統一モデル。
自然画像、Webページ、グラフィックデザインにまたがるさまざまなパブリックデータセットに基づいて、UniARをトレーニングします。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:57:07 GMT)
WAVER: Writing-style Agnostic Video Retrieval via Distilling
Vision-Language Models Through Open-Vocabulary Knowledge [12.0] WAVERはドメイン間知識の蒸留機構であり,書式知能に対処するための手法である。
WAVERは、事前学習された視覚言語モデルに固有のオープン語彙特性を活かし、教師モデルから教師モデルへのテキストベースの知識の伝達に暗黙の知識蒸留アプローチを採用している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:17:37 GMT)
Multi-agent Reinforcement Learning: A Comprehensive Survey [12.0] この調査はマルチエージェントシステム(MAS)の領域を掘り下げ、学習の最適制御の複雑さを解き放つことに特に重点を置いている。
本調査の目的は、MASの様々な次元に関する総合的な洞察を提供することであり、無数の機会に光を当てることである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:16:54 GMT)
Q-Segment: Segmenting Images In-Sensor for Vessel-Based Medical
Diagnosis [11.9] 本稿では、量子化されたリアルタイムセグメンテーションアルゴリズム「Q-Segment」を提案し、2つの低消費電力エッジビジョンプラットフォームに対して包括的評価を行う。
Q-セグメントは1.9msの超低推論時間と5.7mJのエネルギー消費を達成する。
この研究は、エッジベースのイメージセグメンテーションに関する貴重な洞察をもたらし、低消費電力環境に適した効率的なアルゴリズムの基礎を築いた。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:01:41 GMT)
HI-SLAM: Monocular Real-time Dense Mapping with Hybrid Implicit Fields [11.6] 最近のニューラルマッピングフレームワークは有望な結果を示しているが、RGB-Dやポーズ入力に依存している。
我々のアプローチは、高密度SLAMとニューラル暗黙の場を統合する。
ニューラルネットワークの効率的な構築には,マルチレゾリューショングリッド符号化と符号付き距離関数を用いる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:35:37 GMT)
NM-FlowGAN: Modeling sRGB Noise with a Hybrid Approach based on
Normalizing Flows and Generative Adversarial Networks [11.6] NM-FlowGANは、GANと正規化フローの両方の長所を利用するハイブリッドアプローチである。
我々のNM-FlowGANは、sRGBノイズ合成タスクにおいて、他のベースラインよりも優れています。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:09:25 GMT)
PAC-Bayes Generalisation Bounds for Dynamical Systems Including Stable
RNNs [11.3] 離散時間非線形力学系の特殊クラスに対する一般化ギャップに縛られたPAC-Bayesを導出する。
提案した境界はデータセットのサイズが大きくなるにつれて0に収束する。
他の利用可能なバウンダリと異なり、派生したバウンダリは非i.d.データ(時系列)を保持しており、RNNのステップ数で成長しない。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:49:29 GMT)
Variational Connectionist Temporal Classification for Order-Preserving
Sequence Modeling [11.3] 我々は、順序を保つより一般化可能なシーケンスモデルを訓練するのに使用できる損失関数を導出する。
両損失関数はモデル対数類似度に対する変分下界の直接最適化を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 00:35:30 GMT)
Optimal Regret Bounds for Collaborative Learning in Bandits [10.8] 一般的な協調型マルチエージェント・マルチアーム・バンディット・モデルにおける後悔について考察する。
このモデルの下では、順序最適後悔境界を持つ最初のアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:36:13 GMT)
Multi-dimensional Fusion and Consistency for Semi-supervised Medical
Image Segmentation [10.6] 医用画像セグメンテーションに適した新しい半教師付き学習フレームワークを提案する。
我々のアプローチの中心は、革新的なマルチスケールテキスト対応のViT-CNN Fusionスキームである。
本稿では,ロバストな擬似ラベルを生成するためのマルチアクシス一貫性フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:54:04 GMT)
The Optimal Approximation Factors in Misspecified Off-Policy Value
Function Estimation [10.6] 強化学習における理論的保証は、関数近似の誤特定誤差に関して、乗算的爆破要因を負う。
重み付き$L$-normなど,幅広い設定において近似係数について検討した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:11:42 GMT)
Discovering Highly Influential Shortcut Reasoning: An Automated
Template-Free Approach [10.6] 本稿では,ショートカット推論を識別する新しい手法を提案する。
提案手法は,分布外データを利用して,ショートカット推論の重大度を定量化する。
自然言語推論と感性分析の実験により,我々のフレームワークが未知のショートカット推論の発見に成功していることが示された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:45:42 GMT)
Faithful Persona-based Conversational Dataset Generation with Large
Language Models [10.5] 高品質な会話データセットは、ユーザと通信可能なAIモデルを開発する上で不可欠である。
我々は,会話の質を向上しつつ,初期データセットを拡張するためのGenerator-Criticアーキテクチャフレームワークを提案する。
我々はPersona-Chatからシードされた20万の会話からなるSynthetic-Persona-Chatをリリースする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:23:50 GMT)
Bridging the Semantic-Numerical Gap: A Numerical Reasoning Method of
Cross-modal Knowledge Graph for Material Property Prediction [10.4] 意味ノードと数値プロキシノードを用いたクロスモーダルKGを構成する材料KG(NR-KG)の数値推論法を提案する。
KGを標準KGに投影することで、両方のタイプの情報をキャプチャし、グラフニューラルネットワークを使用して材料特性を予測する。
NR-KGは最先端のSOTA(State-of-the-art)法より優れており、2つの材料データセットに対して25.9%と16.1%の相対的な改善を達成している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:31:35 GMT)
Prompting Large Language Models for Topic Modeling [10.3] 大規模言語モデル(LLM)の高度な言語理解を活用する新しいトピックモデリング手法であるPromptTopicを提案する。
個々の文書から文章レベルでトピックを抽出し、これらのトピックを事前定義された量に集約して凝縮し、最終的に様々な長さのテキストに対して一貫性のあるトピックを提供する。
PromptTopicを3つの非常に多様なデータセットの最先端のベースラインに対してベンチマークし、意味のあるトピックを発見する能力を確立しました。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:15:05 GMT)
A Synthesis of Green Architectural Tactics for ML-Enabled Systems [10.3] ML対応システムのための30のグリーンアーキテクチャ戦略のカタログを提供する。
アーキテクチャ戦術は、ソフトウェア品質を改善するための高度な設計手法である。
透明性を高め、その普及を促進するため、我々はオンラインで簡単に消費可能なフォーマットで戦術を利用できるようにした。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:53:45 GMT)
FastSR-NeRF: Improving NeRF Efficiency on Consumer Devices with A Simple
Super-Resolution Pipeline [10.3] ニューラル放射場(NeRF)の出力をアップスケールする超解像(SR)技術が提案されている。
本稿では,SRをコストのかかるトレーニングやアーキテクチャの変更なしに効率向上に活用することを目的としている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:02:23 GMT)
Robust Estimation of Nonlinear Properties of Quantum Processes [10.2] 非線形量子プロセス特性を推定するための2つのプロトコルを提案する。
最初のプロトコルは、時間外相関を推定するための頑健で健全な手法を提供する。
第2のプロトコルはユニタリティを推定し、量子チャネルの不整合を効果的に特徴づける。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:33:11 GMT)
Adaptive action supervision in reinforcement learning from real-world
multi-agent demonstrations [10.2] マルチエージェントシナリオにおける実世界の実演からRLにおける適応的行動監視手法を提案する。
実験では,未知のソースとターゲット環境の異なるダイナミックスを用いて,チェイス・アンド・エスケープとフットボールのタスクを用いて,本手法がベースラインと比較して一般化能力と一般化能力のバランスを保っていることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:20:57 GMT)
End-to-End Training of Neural Networks for Automotive Radar Interference
Mitigation [9.9] 本稿では,周波数変調連続波(WFMC)レーダ相互干渉緩和のためのニューラルネットワーク(NN)のトレーニング手法を提案する。
NNが干渉されたレーダー信号をきれいにするために訓練する代わりに、NNをオブジェクト検出マップ上で直接訓練する。
我々は,レーダを用いた物体検出のアルゴリズムであるCA-CFARピーク検出器の連続的な緩和を行う。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:47:16 GMT)
TSRNet: Simple Framework for Real-time ECG Anomaly Detection with
Multimodal Time and Spectrogram Restoration Network [9.8] 本稿では,異常検出を利用したトレーニング用心電図データのみを用いた不健康状態の同定手法を提案する。
本稿では,心電図信号の異常検出に特化して設計されたTSRNet(Multimodal Time and Spectrogram Restoration Network)を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:27:38 GMT)
Device Scheduling for Relay-assisted Over-the-Air Aggregation in
Federated Learning [9.7] フェデレートラーニング(FL)は、ネットワークの端で分散されたデータを活用して、インテリジェントなアプリケーションを実現する。
本稿では,リレー支援FLフレームワークを提案し,リレー支援FLシステムにおけるデバイススケジューリング問題について検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:04:39 GMT)
WeatherProof: A Paired-Dataset Approach to Semantic Segmentation in
Adverse Weather [9.6] 本稿では,悪天候条件下での画像の性能向上につながる一般的なペア学習手法を提案する。
我々は、正確な晴天と悪天候画像のペアで、最初のセマンティックセグメンテーションデータセットを作成する。
その結果,これら2組の晴天フレームと悪天候フレームのトレーニングにより,悪天候データの性能が向上することが判明した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:57:54 GMT)
Image Matching by Bare Homography [9.4] 本稿では、シーンを粗い局所的な重なり合う平面としてモデル化する、新しい非深度画像マッチングフレームワークであるSlimeを提案する。
平面は互換性のあるマッチングによって相互に拡張され、画像は固定タイルに分割される。
本稿では、エンドツーエンドのディープネットワークとハイブリッドパイプラインで表現される画像マッチングにおける最近の最先端画像の比較分析について述べる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:38:37 GMT)
DriveTrack: A Benchmark for Long-Range Point Tracking in Real-World
Videos [9.3] DriveTrackは、現実世界のビデオのキーポイントトラッキングのための新しいベンチマークとデータ生成フレームワークである。
24時間のビデオにまたがる10億のトラックからなるデータセットをリリースします。
DriveTrackの微調整キーポイントトラッカーは、現実世界のシーンの精度を最大7%向上させる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:06:52 GMT)
Uncovering the Causes of Emotions in Software Developer Communication
Using Zero-shot LLMs [9.3] 正確な機械学習モデルをトレーニングするために使用できる、大規模なソフトウェアエンジニアリング固有のデータセットが必要である。
本稿では,ソフトウェア工学における感情の原因を検出するタスクに特化して微調整されることなく,大量のデータセット上で事前訓練されたゼロショットLCMについて検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:16:16 GMT)
Using machine learning to understand causal relationships between urban
form and travel CO2 emissions across continents [9.2] 都会形態が過去の研究で無視されていた旅行エミッションや施設間効果に有意な因果関係が認められた。
より単心的な都市では,主中心へのアクセスの増加よりも,サブセンター指向の開発がより重要となる空間回廊を同定する。
我々の研究は、エビデンスベースの都市気候ソリューションをスケールするための因果関係、一般化可能性、文脈的特異性の必要性に対処する新しい研究を可能にする機械学習の応用を実証する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:37:42 GMT)
LiteVSR: Efficient Visual Speech Recognition by Learning from Speech
Representations of Unlabeled Data [9.0] 提案手法は,訓練されたコンフォーマーベースASRモデルから知識を抽出し,標準VSRベンチマーク上での競合性能を実現する。
我々のモデルは、数日以内に1つのコンシューマグレードのGPUでトレーニングでき、日付のハードウェア上でリアルタイムのエンドツーエンドのVSRを実行することができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:04:24 GMT)
Social, Legal, Ethical, Empathetic, and Cultural Rules: Compilation and
Reasoning (Extended Version) [9.0] SLEEC(社会的、法的、倫理的、共感的、文化的)ルールは、AIベースの自律システムが従うべき規則の定式化、検証、実施を促進することを目的としている。
AIシステムで効果的な使用を可能にするためには、これらのルールを自動推論をサポートする形式言語に体系的に翻訳する必要がある。
本研究ではまず,SLEEC規則の古典論理への翻訳を正当化するSLEEC規則パターンの言語学的解析を行う。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:23:49 GMT)
Neurosymbolic Value-Inspired AI (Why, What, and How) [8.9] 本稿では,VAI(Value-Inspired AI)というニューロシンボリック・コンピューティング・フレームワークを提案する。
VAIは、人間の価値の様々な次元を表現し、統合することを目的としている。
我々は、この方向における現在の進歩についての洞察を提供し、この分野の将来的な方向性について概説する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:33:57 GMT)
Risk-Aware Continuous Control with Neural Contextual Bandits [8.9] 本稿では,コンテキスト的盗聴問題に対するリスク認識型意思決定フレームワークを提案する。
私たちのフレームワークは、さまざまなリスクレベルに対応し、パフォーマンスに対する制約満足度を効果的にバランスするように設計されています。
5Gモバイルネットワークを含む実世界のユースケースで,我々のフレームワークを評価した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:16:04 GMT)
Rational Sensibility: LLM Enhanced Empathetic Response Generation Guided
by Self-presentation Theory [8.6] 我々は、歴史的対話を意味のある合理的な文に分離する革新的な分類的アプローチを考案した。
我々はLLaMA2-70bを有理脳として使用し、会話に保持される深い論理的情報を分析する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:16:58 GMT)
Automatic nonlinear MPC approximation with closed-loop guarantees [8.6] 閉ループ保証付き非線形モデル予測制御(MPC)スキームを自動近似する問題に対処する。
AlkiA-Xは、数値的によく条件付けられた計算、高速で評価可能な近似関数、および近似誤差に対する任意の所望境界の満足度を保証する非定性アルゴリズムである。
数値実験では、ALKIA-Xを非線形MPCスキームに適用し、最先端手法と比較してオフラインおよびオンライン評価時間を短縮した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:55:05 GMT)
Joint State Estimation and Noise Identification Based on Variational
Optimization [8.5] CVIAKFと呼ばれる共役計算変分推論に基づく新しい適応カルマンフィルタ法を提案する。
CVIAKFの有効性は、目標追尾のための合成および実世界のデータセットを通して検証される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:47:03 GMT)
A systematic review of the use of Deep Learning in Satellite Imagery for
Agriculture [8.5] 現代のディープラーニング手法は、ほとんどのタスクで従来の機械学習よりも一貫して優れていた。
LSTMリカレントニューラルネットワークは、収量予測のためにランダムフォレストを一貫して上回らなかった。
いくつかの研究は、衛星画像で利用可能な余分なスペクトル分解能を特に利用した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:58:36 GMT)
Fast Decision Boundary based Out-of-Distribution Detector [8.3] レイテンシクリティカルなアプリケーションにおけるAIの安全なデプロイには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
近年の研究では,特徴空間情報に基づくOODの検出が有効であることが判明している。
有効性にもかかわらず、特徴空間を離脱するOOD法は、非無視的な計算オーバーヘッドを引き起こす可能性がある。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:50:32 GMT)
Natural-language-driven Simulation Benchmark and Copilot for Efficient
Production of Object Interactions in Virtual Road Scenes [8.3] 仮想道路シーンにおける複数の物体間の相互作用を効率的に生成する自然言語駆動型シミュレーション(NLD)のアイデアを提唱する。
我々は,6種類の道路トポロジにおいて,オブジェクトの相互作用を自然言語で記述したL2Iベンチマークデータセットを収集した。
方法論的なコントリビューションとして,対話記述をレンダリング可能なコードに変換するためにSimCopilotを設計する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:06:36 GMT)
CIF-T: A Novel CIF-based Transducer Architecture for Automatic Speech
Recognition [8.3] 本稿では,CIF(Continuous Integrate-and-Fire)機構をRNN-Tモデルに組み込んだCIF-Transducer(CIF-T)を提案する。
CIF-T は RNN-T モデルと比較して計算オーバーヘッドの少ない最先端の結果が得られる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:13:45 GMT)
Understanding and Improving Adversarial Attacks on Latent Diffusion
Model [8.3] 遅延拡散モデル(LDM)は、画像生成において最先端のパフォーマンスを達成するが、著作権とプライバシの懸念を高める。
LDMに対する敵対的な攻撃は、LDM駆動の少ショット生成において、許可されていない画像が使用されるのを防ぐために生まれる。
本稿では,現在最先端の複数ショット生成パイプラインに対して優れた性能を示すLCMに対する効果的な敵攻撃を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:42:15 GMT)
Simple Binary Hypothesis Testing under Local Differential Privacy and
Communication Constraints [8.3] 局所差分プライバシー (LDP) と通信制約の両面から, 単純な二分仮説テストについて検討する。
我々はその結果をミニマックス最適かインスタンス最適かのどちらかとみなす。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:48:49 GMT)
SocialStigmaQA: A Benchmark to Uncover Stigma Amplification in
Generative Language Models [8.2] 我々は、生成言語モデルにおいて、シュティグマを通して、社会的偏見の増幅を捉えるためのベンチマークを導入する。
私たちのベンチマークであるSocialStigmaQAには、ソーシャルバイアスとモデル堅牢性の両方をテストするために慎重に構築された、さまざまなプロンプトスタイルの約10Kプロンプトが含まれています。
社会的に偏りのあるアウトプットの割合は、様々なデコード戦略やスタイルにまたがって45%から59%の範囲であることがわかった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:30:56 GMT)
LLMs Can Understand Encrypted Prompt: Towards Privacy-Computing Friendly
Transformers [8.2] 本研究では,トランスアーキテクチャにおける計算量および通信量の多い演算子をプライバシ計算フレンドリな近似で置き換えることで,プライベートな推論コストを大幅に削減できることを示す。
我々のパイプラインは計算の5倍の高速化と通信オーバーヘッドの80%削減を実現し、ほぼ同じ精度を維持している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:03:10 GMT)
Grounding for Artificial Intelligence [8.1] 接地とは、自然言語と抽象的な知識を、知的な存在の中で現実世界の内部表現に結びつけるプロセスである。
本稿では,この問題を体系的に研究しようと試みる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:45:48 GMT)
Communication-constrained hypothesis testing: Optimality, robustness,
and reverse data processing inequalities [8.0] 通信制約下での単純な二項仮説テストのサンプルの複雑さは、少なくとも制約のない設定よりも大きい対数係数であることが示される。
我々のフレームワークは、分布が全変動距離で破壊されるような頑健な仮説テストにまで拡張する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:27:39 GMT)
Randomness-enhanced expressivity of quantum neural networks [7.8] 本稿では,量子回路にランダム性を組み込むことにより,QNNの表現性を高める新しい手法を提案する。
我々は、Uhlmannの定理を用いて、任意の対象作用素を正確に近似することができることを証明した。
量子機械学習に広く応用できる複数の学習タスクに対してランダム性を導入することにより,QNNの表現性が向上することを発見した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:18:48 GMT)
On the locality of local neural operator in learning fluid dynamics [7.8] 局所神経演算子(LNO)は、過渡偏微分方程式(PDE)の解法におけるLNOの柔軟性を可能にするコアである
我々はLNOの局所性について,LNOの受容領域と受容範囲を調べた。
本稿では,LNOを適用した多分野のPDEの学習と解法について概説する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:18:54 GMT)
W-MAE: Pre-trained weather model with masked autoencoder for
multi-variable weather forecasting [7.6] 天気予報のための事前学習を行うMasked AutoEncoderを用いた気象モデルを提案する。
W-MAEは、気象変数内の空間的相関を再構成するために、自己教師付きで事前訓練される。
時間スケールでは、事前訓練されたW-MAEを微調整し、気象変数の将来状態を予測する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:34:36 GMT)
Robust Estimation of Causal Heteroscedastic Noise Models [7.6] 学生の$t$-distributionは、より小さなサンプルサイズと極端な値で、全体の分布形態を著しく変えることなく、サンプル変数をサンプリングすることの堅牢さで知られている。
我々の経験的評価は、我々の推定器はより堅牢で、合成ベンチマークと実ベンチマークの総合的な性能が向上していることを示している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:26:35 GMT)
Superdiffusive Transport in Quasi-Particle Dephasing Models [7.5] 準粒子の脱落が超拡散輸送を引き起こすことを示す。
過拡散は、局所的退化準粒子の運動量分布内の結節点から生じる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:17:21 GMT)
TigerBot: An Open Multilingual Multitask LLM [7.4] 大型言語モデル(LLM)のTigerBotファミリをリリースし紹介する。
Llama-2とBLOOMをベースとしたモデルを開発し、データ、トレーニングアルゴリズム、インフラストラクチャ、アプリケーションツールの境界をさらに進める。
TigerBotモデルファミリは、主要な学術的、産業的なベンチマークやリーダーボードでも主要なパフォーマンスを達成している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:42:20 GMT)
Entropy Causal Graphs for Multivariate Time Series Anomaly Detection [7.4] 本研究では,多変量時系列異常検出のためのエントロピー因果グラフであるCGADを提案する。
CGADは転送エントロピーを利用して時系列データ間の因果関係を明らかにするグラフ構造を構築する。
CGADは、15%の平均的な改善で、実世界のデータセット上で最先端の手法より優れています。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:35:00 GMT)
LLaMAntino: LLaMA 2 Models for Effective Text Generation in Italian
Language [7.2] LLaMA(Large Language Model Meta AI)ファミリーは、自然言語処理の分野での新しい進歩を表現している。
本研究は, イタリア語LLMの新しいLLaMAファミリーを導入することで, イタリア語の言語適応戦略に寄与する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:06:22 GMT)
Does Prior Knowledge Help Detect Collisions? [7.1] 形状を知らないアルゴリズムと比較して,形状を知ることの助けとなる全ての局所特性を特徴付ける。
ラベルのない証明書を保持するアルゴリズムは、証明書のないアルゴリズムよりも$Theta(log n)$少ないクエリを必要とする場合もある。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:50:03 GMT)
A Remark on Concept Drift for Dependent Data [7.0] 時間的依存関係がサンプリングプロセスに強く影響していることを示す。
特に、この設定には定常性の概念が適さないことを示し、代替案について議論する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:11:46 GMT)
Sketch and shift: a robust decoder for compressive clustering [6.9] 圧縮学習は、大規模学習のメモリフットプリントを大幅に削減する、新たなアプローチである。
CL-OMPRよりも大幅に改善された代替デコーダを提案する。
提案アルゴリズムは,従来より10倍小さいMNISTデータセットのスケッチからクラスタリング情報を抽出することができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:53:55 GMT)
VMT-Adapter: Parameter-Efficient Transfer Learning for Multi-Task Dense
Scene Understanding [6.8] 大規模な事前訓練モデルを活用するための標準的なアプローチは、下流タスクのすべてのモデルパラメータを微調整することである。
本稿では,複数のタスクから知識を共有するVMT-Adapterを提案する。
また、ダウンプロジェクションとアッププロジェクションの間で共有パラメータを学習することで、トレーニング可能なパラメータをさらに削減するVMT-Adapter-Liteを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:49:19 GMT)
A Unifying Tensor View for Lightweight CNNs [6.8] この研究は、3D形状のカーネルテンソルを様々なスライスワイズとランク1分解にリンクすることで、新しい視点を考案した。
最新のShiftNetへの新たなリンクが確立され、1%の精度で50%近い圧縮を達成した最初のシフトプルーニング層が導入された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:30:59 GMT)
RDR: the Recap, Deliberate, and Respond Method for Enhanced Language
Understanding [6.7] Recap、Deliberate、Respond(RDR)パラダイムは、ニューラルネットワークパイプラインに3つの異なる目的を組み込むことで、この問題に対処する。
これら3つのモデルをカスケードすることにより、ベンチマークをゲームする可能性を軽減し、基盤となるセマンティックパターンをキャプチャする堅牢な方法を確立する。
その結果,標準基準値の最大2%向上とともに,競争基準値と比較して性能が向上した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:41:48 GMT)
Bayesian Estimate of Mean Proper Scores for Diversity-Enhanced Active
Learning [6.7] 期待されている損失削減(ELR)は、分類誤差の低減と、同じフレームワークに適合するより一般的なコストのベイズ推定に焦点を当てている。
本研究では,平均値スコア(BEMPS)のベイズ推定を行い,厳密なスコアの増加を推定する。
我々は,BEMPSが頑健な獲得関数とよく校正された分類器を出力し,他の試験よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:02:17 GMT)
A Novel Ehanced Move Recognition Algorithm Based on Pre-trained Models
with Positional Embeddings [6.7] 要約の認識は、コンテンツを効果的に特定し、記事を明確にするために重要である。
本稿では,中国科学・技術論文の非構造的抽象化に対する注意機構を備えた,改良された事前学習モデルとゲートネットワークを備えた新しい動き認識アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:30:43 GMT)
When and How to Aggregate Message Authentication Codes on Lossy Channels? [6.7] 本稿では,パケット損失が過去15年間に提案されたMACアグリゲーション手法に与える影響について検討する。
我々は、達成可能な出力改善、結果の検証遅延、処理オーバーヘッド、サービス拒否攻撃に対するレジリエンスについて検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:15:35 GMT)
Secure and Accurate Summation of Many Floating-Point Numbers [6.5] セキュアなマルチパーティ技術を用いた浮動小数点超積算器の実装方法を示す。
セキュアなマルチパーティ技術を用いた浮動小数点超積算器の実装方法を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:37:20 GMT)
nuScenes Knowledge Graph -- A comprehensive semantic representation of
traffic scenes for trajectory prediction [6.2] 交通シーンにおける軌道予測は、周囲の車両の挙動を正確に予測する。
車両の走行経路、道路トポロジー、車線分割器、交通規則など、文脈情報を考慮することが重要である。
本稿では,知識グラフを用いて交通シーン内の多様なエンティティとその意味的関係をモデル化する手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:40:34 GMT)
Associative Learning Mechanism for Drug-Target Interaction Prediction [6.1] 薬物-標的親和性(DTA)は薬物-標的相互作用(DTI)の強さを表す
従来の手法では、DTA予測プロセスの解釈可能性に欠けていた。
本稿では,対話型学習と自動エンコーダ機構を備えたDTA予測手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:02:34 GMT)
Entropic uncertainty relations and entanglement detection from quantum
designs [5.9] 設計構造を用いた量子計測に重点を置いたエントロピー不確実性関係と絡み付き検出について検討する。
設計構造測定におけるR'enyiエントロピー不確実性関係の改善を導出した。
設計・構造計測による多粒子絡み検出の基準を得る。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:11:00 GMT)
Capturing Dynamics in Online Public Discourse: A Case Study of Universal
Basic Income Discussions on Reddit [5.9] 本稿では,オンラインプラットフォーム上での意見変化の概念モデルを提案し,それをReddit上でのユニバーサルベーシック・インカムに関する公開談話に応用する。
RedditのUBIに対する全体的な姿勢は、この歴史的な傾向が突然逆転し、Redditがかなり支持的になった2019年中頃まで、大幅に低下していた。
本手法は,現在オンライン上で定期的に行われている大規模公開談話において,世論変化の微妙な要因を特定し,他の重要な問題や政策にも適用することができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:54:10 GMT)
Madtls: Fine-grained Middlebox-aware End-to-end Security for Industrial Communication [5.9] Middlebox-aware DTLS (Madtls) は、産業ネットワークのニーズに合わせた、ミドルボックス対応のエンドツーエンドセキュリティプロトコルである。
Madtlsはミドルボックスのビットレベル読み書きアクセス制御を提供し、制約のあるハードウェアでも最小の帯域幅と処理オーバーヘッドで通信する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:52:04 GMT)
Online Saddle Point Problem and Online Convex-Concave Optimization [5.7] 本稿では,オンラインコンベックス・コンキャブ最適化(OCCO)フレームワークについて述べる。
本稿では、性能指標として一般化双対性ギャップ(Dual-Gap)を提案し、OCCOとDual-Gapとオンライン凸最適化(OCO)の並列性を確立する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:04:24 GMT)
Beyond Empirical Windowing: An Attention-Based Approach for Trust
Prediction in Autonomous Vehicles [5.7] ウィンドウ化は長い時系列データの局所解析を可能にする手法として広く利用されている。
本稿では,ウィンドウプロンプトとマスキングアテンション変換を用いたSelective Windowing Attention Network (SWAN)を提案する。
我々は、新しいマルチモーダル運転シミュレーションデータセットにおいて、信頼予測のタスク上でSWANを評価する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:07:19 GMT)
Gated InAs quantum dots embedded in surface acoustic wave cavities for
low-noise optomechanics [5.6] 自己集合InAs量子ドット(QD)は、光力学的要素を約束する。
分子線エピタキシーとナノファブリケーションを用いたゲートQDとSAWキャビティを統合した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:26:22 GMT)
GPT-doctor: Customizing Large Language Models for Medical Consultation [5.5] 本稿では,Large Language Models (LLM) を一般的なビジネスコンテキストにカスタマイズするための新しいフレームワークを提案する。
LLMにおけるドメイン固有理論とスーパービジョンファインチューニング(SFT)を組み合わせる手法を設計する。
提案するフレームワークを医療相談の文脈でインスタンス化し,GPT-doctorモデルを作成する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:42:19 GMT)
Leveraging Language ID to Calculate Intermediate CTC Loss for Enhanced
Code-Switching Speech Recognition [5.4] ASRモデルのエンコーダの中間層に言語識別情報を導入する。
言語切替処理におけるモデルの混乱を軽減し,言語区別を暗黙的に意味する音響的特徴を生成することを目的としている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:46:35 GMT)
UINav: A maker of UI automation agents [5.3] 機械学習の自動化エージェントは、より一般化するが、単純な手作りのアプリケーションでのみ動作するか、あるいは大規模な事前訓練されたモデルに依存している。
実演ベースのエージェントメーカシステムであるemphUINavを提案する。
UINavエージェントはモバイルデバイスで動かすのに十分軽量だが、わずかな数のタスクデモで高い成功率を達成する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:37:39 GMT)
Using Model-Based Trees with Boosting to Fit Low-Order Functional ANOVA
Models [5.1] 低次関数型ANOVAモデルは、本質的に解釈可能な機械学習の目的のもと、機械学習(ML)コミュニティで再発見された。
我々は,EMMに類似する新しいアルゴリズムであるGAMI-Treeを提案する。
我々は、シミュレーションと実データを用いて、GAMI-Treeの性能と解釈可能性をEMMとGAMI-Netと比較する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:20:55 GMT)
LAENeRF: Local Appearance Editing for Neural Radiance Fields [5.1] LAENeRFは、NeRFのフォトリアリスティックおよびノンフォトリアリスティックな外観編集のためのフレームワークである。
我々は、予想される線量から最終的な出力色へのマッピングを学習し、スタイルロスによって教師できる。
マッピングのために1光線当たりの1点を頼りにすることで、メモリ要件を制限し、高速な最適化を可能にします。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:23:42 GMT)
Automatic Rao-Blackwellization for Sequential Monte Carlo with Belief
Propagation [5.0] 状態空間モデル(SSM)に関する具体的なベイズ予想は、一般には難解である。
本稿では,信念の伝播を用いた閉形式解を可能な限り計算する混合推論アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:05:25 GMT)
Constrained Meta-Reinforcement Learning for Adaptable Safety Guarantee
with Differentiable Convex Programming [4.8] 本稿では,メタラーニングアプローチ(ラーニング・トゥ・ラーン)のレンズを通して制約された問題を解くことによって,非定常環境における安全性を確保するためのユニークな課題について考察する。
まず,複数タスクにまたがるコンベックス制約付きポリシー更新を連続的に採用し,エンドツーエンドの差別化を可能にすることで,制約のあるシナリオにおけるメタラーニングを可能にする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:55:43 GMT)
STEAM & MoSAFE: SOTIF Error-and-Failure Model & Analysis for AI-Enabled
Driving Automation [4.8] 本稿では、SOTIF因果モデルの改良として、STEAM(SotIF Temporal Error and Failure Model)を定義した。
第2に,システム設計モデルに基づくSTEAMのインスタンス化が可能なモデルベースSOTIF解析法(MoSAFE)を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:34:35 GMT)
Single PW takes a shortcut to compound PW in US imaging [4.7] 本研究では、単平面波(PW)から再構成した米国画像とPWCを合成したPWとの類似性を生かした。
高度な拡散モデルを用いることで、米国の画像再構成におけるその効果を実証し、サンプリングステップの大幅な削減を実現した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:33:08 GMT)
Maxwell Demon and Einstein-Podolsky-Rosen Steering [4.7] 量子非局所性相関が作業によってシミュレートできるかどうかを考察する。
そこで、マックスウェルのデモンアシスト型アインシュタイン・ポドルスキー・ローゼンステアリングが提案されている。
我々は,Maxwellデモンアシスト型EPRステアリングの量子回路モデルを構築した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:42:00 GMT)
Investigating Responsible AI for Scientific Research: An Empirical Study [4.6] このような機関におけるResponsible AI(RAI)の推進は、AI設計と開発に倫理的配慮を統合することの重要性の高まりを強調している。
本稿では,AI設計・開発に内在する倫理的リスクに対する意識と準備性を評価することを目的とする。
その結果、倫理的、責任的、包括的AIに関する知識ギャップが明らかとなり、利用可能なAI倫理フレームワークに対する認識が制限された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:40:27 GMT)
Optical-pumping enantio-conversion of chiral mixtures in presence of
tunneling between chiral states [4.5] 左右のキラル状態間のトンネル相互作用は重要であり無視できない。
キラル分子の4レベルモデルに基づく光ポンピングによるキラル混合物のエナンチオ変換手法を提案する。
その結果, 高効率エナンチオ変換は, 系の散逸とキラル状態選択励起の複合効果により達成されることがわかった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:38:31 GMT)
SpeedUpNet: A Plug-and-Play Hyper-Network for Accelerating Text-to-Image
Diffusion Models [4.5] 我々はSpeedUpNet(SUN)と呼ばれる新しいSD加速モジュールを提案する。
SUNは追加の訓練なしに様々な細調整されたSDモデルに直接接続することができる。
SUNは推論ステップの数をわずか4ステップに減らし、分類子なしのガイダンスを不要にする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:52:44 GMT)
A Novel Dataset for Financial Education Text Simplification in Spanish [4.5] スペイン語では、テキスト単純化システムを作成するために使用できるデータセットはほとんどない。
我々は、確立された単純化規則を用いて、5,314の複雑で単純化された文対からなるデータセットを作成しました。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:47:08 GMT)
Keep the Faith: Faithful Explanations in Convolutional Neural Networks
for Case-Based Reasoning [4.4] ケースベース推論のアーキテクチャがProtoPNetの例を用いて忠実な説明に必要な確立された公理を満たすか否かを評価する。
このようなアーキテクチャは、忠実な説明の抽出を可能にする。
本稿では,ProtoPFaith という名前の訓練された ProtoPNet に対する説明を抽出する手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:36:54 GMT)
Fine-Tuned Self-Supervised Speech Representations for Language
Diarization in Multilingual Code-Switched Speech [4.4] 大規模自己教師型アーキテクチャ(WavLM)から抽出した微調整音声表現を用いた連続多言語ダイアリザを開発した。
南アフリカ語5言語(isiZulu, isiXa, Seswana, Sesotho, English)からなるコード交換コーパスを実験した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:40:41 GMT)
Multiscale Vision Transformer With Deep Clustering-Guided Refinement for
Weakly Supervised Object Localization [4.3] この研究は、弱教師付きオブジェクトローカライゼーションの課題に対処する。
様々なスケールでパッチ埋め込みを抽出する複数のオブジェクトローカライゼーション変換器を備える。
本稿では,局所化精度をさらに高めるディープクラスタリング誘導改良法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:46:44 GMT)
How to Raise a Robot -- A Case for Neuro-Symbolic AI in Constrained Task
Planning for Humanoid Assistive Robots [4.3] ロボットタスク計画手法を用いて,プライバシ,セキュリティ,アクセス制御の制約を取り入れた新しい分野を探求する。
本稿では,古典的シンボリックアプローチ,深層学習ニューラルネットワーク,および知識ベースとして大規模言語モデルを用いた現代的アイデアに関する予備的結果を報告する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:52:51 GMT)
Learning to Infer Unobserved Behaviors: Estimating User's Preference for
a Site over Other Sites [4.3] 焦点サイトに対する個人ユーザの嗜好を推定する手法を提案する。
我々は、他のサイトからのデータなしに、ユーザのオンラインエンゲージメントの焦点サイトのシェアを計算する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:43:21 GMT)
Multispectral Stereo-Image Fusion for 3D Hyperspectral Scene
Reconstruction [4.2] 本稿では,異なるスペクトル範囲をカバーする2つの校正マルチスペクトルリアルタイム能動スナップショットカメラをステレオシステムに組み合わせた新しいアプローチを提案する。
異なるマルチスペクトルスナップショットカメラの併用により、3次元再構成とスペクトル解析の両方が可能となる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:20:35 GMT)
Optimal Estimation of Generic Dynamics by Path-Dependent Neural Jump
ODEs [4.2] 本稿では,NJ-ODE(Neural Jump ODE)フレームワークの経路依存拡張を用いた一般プロセスの予測問題について検討する。
PD-NJ-ODEは古典的なフィルタリング問題や順序帳(LOB)データにうまく適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:03:15 GMT)
A Survey on Blood Pressure Measurement Technologies: Addressing
Potential Sources of Bias [4.1] 血圧モニタリング(BP)は、心臓血管疾患の予防、診断、治療、管理において重要な役割を担っている。
最近のガイドラインでは、定期的な臨床訪問や自宅でのBPモニタリングが推奨されている。
BP測定は、測定やデバイスエラー、人口統計、身体習慣などの要因によって、かなりのバイアスとばらつきを示す可能性がある。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:57:34 GMT)
Mava: a research library for distributed multi-agent reinforcement
learning in JAX [4.0] マルチエージェント強化学習(MARL)の研究は本質的に計算コストが高い。
MARLアルゴリズムは一般に設計が複雑であり、正しく実装することが難しい。
JAXで書かれたMARLのための研究ライブラリであるMavaを紹介します。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:29:24 GMT)
Probing Pretrained Language Models with Hierarchy Properties [4.0] 本研究では, PLM が複雑な分類学関係をどの程度捉えることができるかを評価することができるタスク非依存評価手法を提案する。
提案するプロパティを PLM に注入することで,階層構造に対する理解を深めることができることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:31:36 GMT)
Tighter monogamy inequalities of multiqubit entanglement [3.9] マルチパーティの絡み合いは、量子情報処理において非常に重要である。
2つの新しいモノガミーの不等式は、$beta$thのコンカレンスと負性に基づくものである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:00:06 GMT)
The Missing U for Efficient Diffusion Models [3.9] 拡散確率モデル(Diffusion Probabilistic Models)は、画像合成、ビデオ生成、分子設計などのタスクにおいて、記録破りのパフォーマンスをもたらす。
それらの能力にもかかわらず、その効率、特に逆過程では、収束速度が遅いことと計算コストが高いため、依然として課題である。
本研究では,連続力学系を利用した拡散モデルのための新しいデノナイジングネットワークの設計手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:09:51 GMT)
CAT: A Causally Graph Attention Network for Trimming Heterophilic Graph [3.9] グラフ注意ネットワーク(GAT)は、グラフ上のより優れた局所的な集約のために、近隣ノードの重要性を適応的に学習するように設計されている。
既存のGATは、異種近傍の高割合が中心ノードの自己認識を弱めるため、異種グラフにおいて顕著な識別能力の低下に悩まされる。
本稿では,隣接するノードの抽出効果(DE)を推定し,弱めるために,異種グラフをトリミングするCausally graph Attention Networkを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:56:36 GMT)
Modeling Unknown Stochastic Dynamical System via Autoencoder [3.9] 本稿では,未知の力学系に対する正確な予測モデルを軌道データから学習する数値的手法を提案する。
オートエンコーダ(autoencoder)というアイデアを使って、観測されていない潜在確率変数を識別する。
また、非ガウス雑音によって駆動されるシステムにも適用できる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:19:22 GMT)
Is ChatGPT a game changer for geocoding -- a benchmark for geocoding
address parsing techniques [3.8] 実運用におけるジオコーディングシステムの実際の入力ログから抽出した人間の入力パターンに基づいて合成された低品質アドレス記述のベンチマークデータセットを提案する。
このデータセットには21の異なる入力エラーとバリエーションがあり、アメリカ50州とワシントンD.C.の通りから一意に選択された239,000以上のアドレス記録が含まれている。
アドレス成分抽出におけるGPT-3モデルの性能を,トランスフォーマーベースモデルとLSTMベースモデルとを比較して評価する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:19:59 GMT)
PPFM: Image denoising in photon-counting CT using single-step posterior
sampling Poisson flow generative models [3.7] 低用量および光子計数CTのための新しい画像デノナイズ技術であるPPFM(Postor sample Poisson Flow Generative Model)を提案する。
その結果、拡散モデルと比較してPFGM++フレームワークの利点が明らかになった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:49:08 GMT)
Deep Unsupervised Domain Adaptation for Time Series Classification: a
Benchmark [3.6] Unsupervised Domain Adaptation (UDA)は、ラベル付きソースデータを利用してラベルなしターゲットデータのモデルをトレーニングすることを目的としている。
本稿では,時系列分類のためのUDA手法の評価ベンチマークを提案する。
さまざまなドメインシフトと時間的ダイナミクスをカバーする7つの新しいベンチマークデータセットを提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:03:55 GMT)
Verification-Friendly Deep Neural Networks [3.6] 検証フレンドリなニューラルネットワーク(VNN)を生成するための新しいフレームワークを提案する。
提案手法は,予測性能の点で元のネットワークに匹敵するネットワークを実現する。
これにより、ディープニューラルネットワークよりも多くのVNNに対して堅牢性を確立することができます。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:39:27 GMT)
Simple Weak Coresets for Non-Decomposable Classification Measures [3.6] また,一様サンプリングに基づくコアセットは,理論的保証による実証性能にも優れることを示した。
我々はF1スコアとマシューズ相関係数に焦点をあて、最適化し難い2つの広く使われている非分解対象関数を最適化し、一様コアセットがコアセットサイズに対して低い境界に達することを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:32:25 GMT)
Concept Prerequisite Relation Prediction by Using
Permutation-Equivariant Directed Graph Neural Networks [3.6] CPRPは、概念の前提条件関係予測であり、AIを教育に利用する上での基本的な課題である。
Wesfeiler-Lehman 検定を GNN 学習に導入することにより,変分同変の有向 GNN モデルを提案する。
我々のモデルは最先端の手法よりも優れた予測性能を提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:01:56 GMT)
Adversarial Robustness on Image Classification with $k$-means [3.5] 我々は、攻撃に対する$k$-meansクラスタリングアルゴリズムの脆弱性を評価し、関連するセキュリティリスクを強調した。
敵シナリオにおけるテスト性能を向上させるための敵訓練手法を導入・評価する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:51:43 GMT)
Beyond Over-Protection: A Targeted Approach to Spectre Mitigation and Performance Optimization [3.4] LLVMの投機的負荷硬化は、投機状態を追跡し、誤特定時に値をマスキングすることで、漏洩を防止する。
既存のサイドチャネルモデル検証フレームワークであるScam-Vを拡張して、Spectre-PHT攻撃に対するプログラムの脆弱性をチェックし、slhアプローチを用いてプログラムの保護を最適化する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:16:50 GMT)
A Survey of Classical And Quantum Sequence Models [3.4] 本稿では,古典的自己アテンションモデルとその量子モデルの比較分析を行う。
我々はこれらの既存手法の重要代表集合を再実装し、量子自己アテンションを用いた画像分類アプローチを適用して量子ハイブリッドトランスを作成する。
また、異なる符号化手法を探求し、位置符号化を量子自己認識ニューラルネットワークに導入することにより、テキストと画像の分類実験における精度の向上とより高速な収束を実現する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:21:26 GMT)
Distilling Large Language Models for Matching Patients to Clinical
Trials [3.4] 近年の大規模言語モデル(LLMs)の成功は、医療分野における彼らの採用の道を開いた。
本研究は,患者と臨床の整合性に対するプロプライエタリ (GPT-3.5, GPT-4) とオープンソース LLM (LLAMA 7B, 13B, 70B) の併用性について,最初の系統的検討を行った。
この制限された合成データセットを微調整したオープンソースのLLMは、プロプライエタリなデータセットと同等の性能を示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:11:07 GMT)
The Impact of AI Innovations on U.S. Occupations [3.4] 職業に対するAIの影響は、タスクの複雑さに基づいた単純な分類に反する。
スキャンなどの基本的なスキルは影響するかもしれないが、料理のようなスキルは影響を受けない。
AIの影響は知識中心の領域を超えて拡大する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:02:06 GMT)
Fast Sampling generative model for Ultrasound image reconstruction [3.4] 本稿では,超音波信号とデータ駆動前のデータ一貫性を同時に実施する新しいサンプリングフレームワークを提案する。
高度な拡散モデルを利用することで、高品質な画像の生成が大幅に高速化される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:28:17 GMT)
Approximation Algorithms for Preference Aggregation Using CP-Nets [3.3] 本稿では,条件付き選好ネットワーク(CP-nets)上での選好を集約する近似アルゴリズムの設計と解析について述べる。
その焦点は、一般に最適な解が指数関数的な大きさであることが知られている、いわゆる「エンフスワップ」よりも、優先的な選好を集約することである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:06:57 GMT)
Adiabatic-Passage Based Parameter Setting Method for Quantum Approximate
Optimization Algorithm on 3-SAT Problem [3.3] 量子近似最適化アルゴリズム (QAOA) は最適化問題に対処するための重要な可能性を示す。
パラメータ設定のための既存の手法は、一般に少なくとも超線形最適化コストを発生させる。
本稿では,パラメータ設定手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:56:13 GMT)
RecurSeed and EdgePredictMix: Pseudo-Label Refinement Learning for
Weakly Supervised Semantic Segmentation across Single- and Multi-Stage
Frameworks [3.3] イメージレベルラベル(WSSS-IL)のみを用いた弱い教師付きセマンティックセマンティックセマンティックセマンティクスは、潜在的に有用である。
しかし、パフォーマンスと実装の複雑さは依然としてアプリケーションを制限する。
本稿では,非検出と偽検出を交互に削減するRecurSeedを提案する。
また、オブジェクトのエッジをさらに表現するEdgePredictMixと呼ばれる新しいデータ拡張(DA)アプローチを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:47:11 GMT)
Sequence adaptive field-imperfection estimation (SAFE): retrospective
estimation and correction of $B_1^+$ and $B_0$ inhomogeneities for enhanced
MRF quantification [3.2] キャリブレーションなしのシーケンス適応型ディープラーニングフレームワークを提案し、任意のMDFシーケンスの効果を$B_+$および$B_$で推定・補正する。
トレーニングデータが得られなかった3Tの任意のMRFシーケンスで、その能力を実証する。
このようなアプローチは、以前買収された将来のMRFスキャンにも適用できる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:54:20 GMT)
Colour Passing Revisited: Lifted Model Construction with Commutative
Factors [3.1] 本稿では、論理変数を用いて特定の推論アルゴリズムとは無関係に昇降表現を構成するカラーパスアルゴリズムの修正版を提案する。
提案アルゴリズムは, 技術状況よりも多くの対称性を効率的に検出し, 圧縮を劇的に増加させ, オンラインクエリ時間を大幅に高速化する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:28:09 GMT)
Targeted Machine Learning for Average Causal Effect Estimation Using the
Front-Door Functional [3.0] 結果に対する治療の平均因果効果(ACE)を評価することは、しばしば観察研究における要因の相違によって引き起こされる課題を克服することを伴う。
本稿では,目標最小損失推定理論に基づいて,正面基準の新たな推定手法を提案する。
本研究では,早期学業成績が今後の年収に与える影響を明らかにするために,これらの推定装置の適用性を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:04:53 GMT)
Physics-informed Neural Network Estimation of Material Properties in
Soft Tissue Nonlinear Biomechanical Models [3.0] 物理インフォームドニューラルネットワーク(PINN)と3次元軟組織非線形生体力学モデルを組み合わせた新しいアプローチを提案する。
提案した学習アルゴリズムは、限られた量の変位から情報を符号化し、場合によっては、臨床環境で日常的に取得できる歪みデータを符号化する。
提案手法の精度とロバスト性を示すために,いくつかのベンチマークを行った。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:41:20 GMT)
Scalable and hyper-parameter-free non-parametric covariate shift
adaptation with conditional sampling [3.0] 共変量シフト適応に対する新しい非パラメトリックアプローチを提案する。
私たちの基本的な考え方は、ソースデータセットにある$k$-nearestの隣人によってラベル付けされていないターゲットデータをラベル付けすることにあります。
その結果,対象データの結合確率分布を推定するための収束速度が急上昇することがわかった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:28:09 GMT)
Object Recognition from Scientific Document based on Compartment
Refinement Framework [2.9] 膨大な資源から貴重な情報を効率的に抽出することがますます重要になっている。
科学文書の現在のデータ抽出方法は、ルールベース(RB)または機械学習(ML)アプローチを用いるのが一般的である。
我々はCTBR(Compartment & Text Blocks Refinement)と呼ばれる新しい文書レイアウト分析フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:25:49 GMT)
Experimental realization of stable exceptional chains protected by
non-Hermitian latent symmetries unique to mechanical systems [2.9] 例外点の直線は対称性を必要としない三次元非エルミートパラメータ空間において堅牢である。
そのような場合の1つは例外連鎖(EC)であり、これは複数の例外線(EL)の交叉または浸透によって形成される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:48:06 GMT)
PathoDuet: Foundation Models for Pathological Slide Analysis of H&E and
IHC Stains [2.8] PathoDuetは,病理組織像の事前学習モデルであり,病理組織学における新たな自己教師型学習フレームワークである。
このフレームワークは、新しく導入されたプリテキストトークンと後続のタスクライザーによって特徴付けられ、画像間の特定の関係を明示的に活用する。
これに基づいて、ヘマトキシリンとエオシンの画像上でモデルを事前訓練するために、クロススケール位置決めとクロスステイン転送という2つのプレテキストタスクが設計された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:45:52 GMT)
Stylebook: Content-Dependent Speaking Style Modeling for Any-to-Any
Voice Conversion using Only Speech Data [2.6] 本稿では,ターゲット発話からリッチなスタイル情報を抽出し,ソース音声コンテンツに効率的に転送する手法を提案する。
提案手法では,自己教師付き学習(SSL)モデルを用いた注意機構を提案する。
実験結果から,提案手法と拡散型生成モデルを組み合わせることで,任意の音声変換タスクにおいて,話者の類似性が向上できることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:36:41 GMT)
She had Cobalt Blue Eyes: Prompt Testing to Create Aligned and
Sustainable Language Models [2.6] 最近の出来事は、従来の訓練された大規模言語モデル(LLM)に関する倫理的懸念を示している
公平で安全で堅牢なLCMの開発を促進するための一連のプロンプトを紹介します。
テストスイートは、GPT-3.5, GPT-4, OPT, LLaMA-2の4つの最先端言語モデルの出力を評価する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:45:51 GMT)
Optimal joint cutting of two-qubit rotation gates [2.6] 仮想ゲート・テレポーテーションプロトコルに基づく2ビット回転ゲートの連成切断方式を提案する。
回路分割間の古典的な通信は不要であることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:52:04 GMT)
IR-UWB Radar-Based Contactless Silent Speech Recognition of Vowels,
Consonants, Words, and Phrases [2.5] インパルス無線超広帯域(IR-UWB)レーダーは、ユーザの調音器や関連する身体部品と物理的に接触することなく動作することができる。
これらの利点には、高範囲の解像度、高透過性、低消費電力、外部の光や音の干渉に対する堅牢性、空間に制約のあるハンドヘルドデバイスに組み込む能力などがある。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:04:40 GMT)
Video-based Surgical Skill Assessment using Tree-based Gaussian Process
Classifier [2.4] 提案したパイプラインは,ビデオデータを用いた外科的スキル評価における計算効率と精度の向上に寄与する。
本研究の結果から, 術者間のスキル向上を促進し, 患者の安全を向上する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:06:22 GMT)
Extrapolated cross-validation for randomized ensembles [2.4] 本稿では,ランダム化アンサンブルにおけるアンサンブルとサブアンブルサイズを調整するためのクロスバリデーション手法ECVを提案する。
我々は,ECVが2乗予測リスクに対して$delta$-Optimalアンサンブルを得られることを示す。
サンプル分割クロスバリデーションと$K$-foldクロスバリデーションと比較して、ECVはサンプル分割を避けて高い精度を達成する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:13:09 GMT)
High-throughput Biomedical Relation Extraction for Semi-Structured Web
Articles Empowered by Large Language Models [2.3] 関係抽出タスクをChatGPTのような大規模言語モデルの単純なバイナリ分類問題として定式化する。
本手法は,主タイトルをテールエンティティとして指定した半構造化ウェブ記事に適合する。
長さのコンテンツはテキストチャンクにスライスされ、埋め込みされ、追加の埋め込みモデルで検索される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:25:34 GMT)
Generic Unsupervised Optimization for a Latent Variable Model With
Exponential Family Observables [2.3] 潜時変数モデル(LVM)は、潜時変数のパラメータ化関数によって観測された変数を表す。
教師なし学習では、特定の非ガウス可観測体を仮定するLVMが検討されている。
指数関数系分布に対して同じ関数形式を特徴とする,非常に簡潔なパラメータ更新方程式の集合を導出できることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:01:20 GMT)
Improving new physics searches with diffusion models for event
observables and jet constituents [2.3] 我々は,LHCにおける新しい物理探索の感度を高めるために,Drapesと呼ばれる新しい手法を導入する。
サイドバンドデータ上で拡散モデルをトレーニングすることにより,信号領域の背景テンプレートをノイズから直接生成するか,あるいは既存のデータに拡散過程を部分的に適用するかを示す。
この手法をLHCOジジェットデータセットを用いた共鳴探索に適用し,高レベルの入力特徴を用いた背景テンプレート生成のための最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:53:10 GMT)
SafeAR: Towards Safer Algorithmic Recourse by Risk-Aware Policies [2.3] 本稿では,コストの変動を考慮したレコメンデーションポリシーの計算手法を提案する。
我々は,既存のデシダラタが高コストのリスクを捕捉できないことを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:05:30 GMT)
3FM: Multi-modal Meta-learning for Federated Tasks [2.1] マルチモーダルなフェデレーションタスクに特化して設計されたメタラーニングフレームワークを提案する。
当社のアプローチは,新たなモダリティに曝露した場合に,フェデレーションモデルによる堅牢な適応を可能にする必要性に起因している。
提案アルゴリズムは,欠落したモダリティシナリオのサブセットにおいて,ベースラインよりも優れた性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:03:24 GMT)
Learning Distributions on Manifolds with Free-form Flows [2.1] トレーニングは、最近提案されたフリーフォームフローフレームワークの適応によって達成される。
中心となる考え方は、接空間で評価されたトレースを通して負の対数様の勾配を推定することである。
従来の作業に比べて、競争性能での推測が大幅に速いことが分かりました。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:58:34 GMT)
Accelerating Neural Network Training: A Brief Review [2.1] 本研究では,ディープニューラルネットワーク(DNN)の学習過程を高速化するための革新的なアプローチについて検討する。
この研究は、グラディエント累積(GA)、自動混合精度(AMP)、ピンメモリ(PM)などの高度な手法を利用する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:43:45 GMT)
What's Next? Predicting Hamiltonian Dynamics from Discrete Observations
of a Vector Field [2.0] ベクトル場の離散的な観測からハミルトニアン系の力学を予測するいくつかの方法を提案する。
我々は経験的かつ相対的に手法を評価し、システムがハミルトニアンであるという情報を効果的に情報化できることを観察する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:48:25 GMT)
Longformer: Longitudinal Transformer for Alzheimer's Disease
Classification with Structural MRIs [1.9] 本稿では,各時点のsMRI上で空間的に注意機構を実行するトランスフォーマーネットワークであるLongformerを提案する。
我々のLongformerは、ADデータセットを用いてアルツハイマー病(AD)の異なる段階を分離する2つのバイナリ分類タスクにおいて、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:44:59 GMT)
A novel dual-stream time-frequency contrastive pretext tasks framework
for sleep stage classification [1.9] 本研究では、時間領域と周波数領域の両方で動作する二重ストリームプリテキスト・タスク・アーキテクチャを提案する。
我々は、新しい周波数類似性(FS)プリテキストタスクを2つの既存のプリテキストタスク、相対的位置決め(RP)と時間的シャッフル(TS)に組み入れた。
FSの導入により、ダウンストリームタスクの精度が大幅に改善され、RPが1.28パーセント改善、TSが2.02%改善された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:05:06 GMT)
Sample-Efficient Learning to Solve a Real-World Labyrinth Game Using
Data-Augmented Model-Based Reinforcement Learning [1.9] 本稿では,ラビリンスゲームをナビゲートし,解決するために設計されたロボットシステムの開発と訓練について述べる。
この方法は、カメラ画像から低次元の観察を抽出することと、迷路内の現在の位置を中心に、収穫され、修正された画像パッチを抽出することを含む。
トレーニングデータを増強するために,システム固有の対称性を利用する。
われわれのアプローチは、実世界のトレーニングデータをわずか5時間で、人気の高いラビリンスゲームを記録的に解くことに成功している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:08:49 GMT)
Involutive Markov categories and the quantum de Finetti theorem [1.9] インボリューティブマルコフ圏は、パルジニャートの量子圏よりも単純であることを示す。
最小の C*-テンソルノルムと最大の C*-テンソルノルムの両方に対して量子デ・フィネッティの定理を証明する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:26:19 GMT)
Grammatical information in BERT sentence embeddings as two-dimensional
arrays [1.9] 分散表現において,特定の文法情報にアクセス可能であるかどうかを検討する。
1次元配列として符号化された通常の文表現は規則的規則性の抽出を容易にサポートしていないが、これらのベクトルの2次元再構成により、様々な学習アーキテクチャがそのような情報にアクセスできるようになる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:41:52 GMT)
FO-PINNs: A First-Order formulation for Physics Informed Neural Networks [1.9] 物理インフォームドニューラルネットワーク(英: Physics-Informed Neural Networks、PINN)は、物理システムの応答をシミュレーションデータなしで学習するディープラーニングニューラルネットワークのクラスである。
PINNは前方および逆問題の解決に有効であるが、パラメータ化システムでは精度が大幅に低下する。
PDE損失関数の1次定式化を用いてトレーニングした1次物理学情報ニューラルネットワーク(FO-PINN)を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:15:11 GMT)
Hypothesis Testing for Class-Conditional Noise Using Local Maximum
Likelihood [1.9] 教師付き学習では、学習が行われる前にラベルの質を自動的に評価することがオープンな研究課題である。
本稿では,本モデルが局所極大近似推定の積である場合,同様の手順を踏襲できることを示す。
この異なるビューは、よりリッチなモデルクラスへのアクセスを提供することで、テストのより広範な適用を可能にする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:14:58 GMT)
ACPO: AI-Enabled Compiler-Driven Program Optimization [1.9] 本稿では, ACPO: textbfunderlineAI-Enabled textbfunderlineCompiler-driven textbfunderlineProgram textbfunderlineOptimizationについて述べる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:49:24 GMT)
Space-Fluid Adaptive Sampling by Self-Organisation [1.8] 協調型適応サンプリングによる空間現象推定のための分散協調戦略を考案する。
我々の設計は、空間を競合する領域に動的に分割し、正確なアグリゲーション・サンプリングを提供するという考え方に基づいている。
本研究では,フィールドベース協調フレームワークにおける適応型サンプリングアルゴリズムを提案し,自己安定化と局所最適性を証明した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:15:25 GMT)
Learned Regularization for Inverse Problems: Insights from a Spectral
Model [1.8] 本稿では,逆問題に対する最先端の学習手法に関する理論的に確立された研究結果を提供する。
正規化法とそれらの収束を、基礎となるデータ分布の観点から拡張した定義を与える。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:50:14 GMT)
Expert-Level Annotation Quality Achieved by Gamified Crowdsourcing for
B-line Segmentation in Lung Ultrasound [1.7] ゲーミフィケードクラウドソーシングは、医療データに対する高精度なアノテーションを大規模に取得する可能性を示している。
21,154点の注釈を収集し,B線分画(肺の混雑の指標)を留置した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:54:36 GMT)
SteloCoder: a Decoder-Only LLM for Multi-Language to Python Code
Translation [1.7] 我々は,SteloCoderを紹介した。SteloCoderは,言語からPythonへのコード変換のための,デコーダのみのStarCoderベースのシステムである。
SteloCoderは、入力プログラミング言語を指定せずに、C++、C#、JavaScript、Java、PHPからPythonへのコード変換を実現する。
XLCoSTの実験により、SteroCoderは、マルチプログラミング言語からPythonへの翻訳において平均73.76のCodeBLEUスコアを達成した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:40:41 GMT)
Closing the Gap: Achieving Better Accuracy-Robustness Tradeoffs Against
Query-Based Attacks [1.7] クエリベースの攻撃を緩和する際のロバスト性と精度の確固たるトレードオフを、テスト時に効率的に確立する方法を示す。
提案手法は,現状のアプローチと比較して,ロバスト性と精度のトレードオフを良好に確保することで,これらの防御性を高めることができることを確認した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:02:19 GMT)
Stethoscope-guided Supervised Contrastive Learning for Cross-domain
Adaptation on Respiratory Sound Classification [1.7] 本稿では、ソースドメインから異なるターゲットドメインに知識を転送するクロスドメイン適応手法を提案する。
特に、個々の領域として異なる聴診器タイプを考慮し、新しい聴診器誘導型教師付きコントラスト学習手法を提案する。
ICBHIデータセットの実験結果から,提案手法はドメイン依存性の低減とICBHIスコア61.71%の達成に有効であることが示された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:34:31 GMT)
Explainable Time Series Anomaly Detection using Masked Latent Generative
Modeling [1.6] 本稿では,新しい時系列異常検出法であるTimeVQVAE-ADを提案する。
TimeVQVAE-ADは、優れた説明性を提供しながら、優れた検出精度を実現する。
私たちはGitHubに実装を提供しています。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:29:34 GMT)
Fragility, Robustness and Antifragility in Deep Learning [1.5] 本稿では,ネットワークパラメータ除去のための信号処理技術に基づくディープニューラルネットワーク(DNN)の系統的解析を提案する。
提案手法は,DNNの性能がクリーンかつ逆向きに摂動したテストデータセットに負,不変,あるいは正の影響を及ぼすかどうかを解析する。
本手法は,ロバストパラメータとアンチフレジャルパラメータのみを選択的に再トレーニングした場合に,ResNetとShuffleNetモデルのテスト精度を向上させることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:20:16 GMT)
Towards Context-Aware Domain Generalization: Representing Environments
with Permutation-Invariant Networks [1.5] 我々は、コンテキストの概念をデータポイントの集合の置換不変表現として定式化する。
これらの表現は、標準的な教師付き学習目標と共同で学習される。
我々は、モデルを不当な外挿でタスクするシナリオを確実に検出できることを示します。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:18:07 GMT)
Classical and quantum cost of measurement strategies for
quantum-enhanced auxiliary field Quantum Monte Carlo [1.5] 補助場量子モンテカルロ(QC-AFQMC)は、量子コンピュータからの出力を使用して、古典的な量子コンピュータの精度を高める。
本稿では,このアルゴリズムの適用性について,量子コンピュータから要求される測定数と,これらの測定を後処理する古典的コストの観点から検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:18:49 GMT)
Random singlets and permutation symmetry in the disordered spin-2
Heisenberg chain: A tensor network renormalization group study [1.5] 交互結合強度分布を持つ反強磁性ハイゼンベルク鎖をランダムに$S=2$で研究する。
ランダム性がない場合、結合交代は、$S=2$ハルデン相と部分的に二量化相の間の2つの量子臨界点を誘導する。
本研究は, 有限二量体化を伴う中間疾患における多臨界点の存在を実証するものである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:15:24 GMT)
Symbolic Numeric Planning with Patterns [1.5] 我々は,有界$n$を持つ$Pi$のプランを,最先端のロールアップと緩和された$exists$エンコーディングよりも少ない変数と/または節の式として見つけるという問題をエンコードする。
我々は,今年の国際計画コンペティションにおいて,プランナーのPattyが極めて優れたパフォーマンスを示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:20:25 GMT)
CRNNet: Copy Recurrent Neural Network Structure Network [1.3] 本稿では,合併症を検出するための新しい EHR コーディングフレームワークを提案する。
提案するコピーモジュールと逆学習戦略により,複雑な疾患を効果的に同定する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:19:42 GMT)
Student as an Inherent Denoiser of Noisy Teacher [1.3] 教師モデルによって生成された擬似ラベルは通常ノイズが多く、知識蒸留(KD)のパフォーマンスに影響を与える可能性がある。
この研究は、ノイズの多い教師とKDを融合させ、学生モデルが既により正確な予測を生成できることを明らかにする。
実験により、Pier-Advised KD は50の人ラベルデータで LLM を約5%上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:21:45 GMT)
In vivo learning-based control of microbial populations density in
bioreactors [1.2] 微生物をバイオファクトリーとして利用するための重要な問題は、望まれる密度と組成で細胞群集に到達し維持することである。
本研究では,バイオリアクターの細菌集団の密度を調節できる,利用可能な制御アルゴリズムのツールボックスを拡張するための学習ベースの戦略を開発する。
本研究は, バイオリアクターの細胞密度制御のための学習ベースの戦略の実現可能性を示し, 微生物コンソーシアムの構成制御への活用に向けて一歩前進する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:27:31 GMT)
Prediction of rare events in the operation of household equipment using
co-evolving time series [1.1] 我々のアプローチは、データの時間的挙動を利用して予測能力を向上する重み付き自己回帰モデルである。
合成および実世界のデータセットの評価は、我々の手法が家庭機器の故障予測手法よりも優れていることを裏付けている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 00:21:00 GMT)
Gradient Based Hybridization of PSO [1.1] Particle Swarm Optimization (PSO) は、過去30年間にわたって、強力なメタヒューリスティックなグローバル最適化アプローチとして現れてきた。
PSOは、単一目的シナリオにおける早期の停滞や、探索と搾取のバランスを取る必要性といった課題に直面している。
多様なパラダイムから確立された最適化手法と協調的な性質を統合することでPSOをハイブリダイズすることは、有望な解決策となる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:26:36 GMT)
Optimization meets Machine Learning: An Exact Algorithm for
Semi-Supervised Support Vector Machines [1.1] サポートベクトルマシン(SVM)は、バイナリ分類のための教師付き学習モデルである。
半定値プログラミング(SDP)緩和を用いたS3VMの新しい分岐手法を提案する。
SDP緩和は文献で利用できるものよりもはるかに強い境界を提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:44:54 GMT)
Vectorizing string entries for data processing on tables: when are
larger language models better? [1.1] テーブル上の14の分析課題における言語モデルの利点について検討する。
より大きな言語モデルはより良い性能を示す傾向があるが、埋め込み目的のためにそれらを微調整することは有用である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:23:56 GMT)
VoCopilot: Voice-Activated Tracking of Everyday Interactions [1.0] 本稿では,VoCopilotと呼ばれる新しい音声追跡システムを設計する取り組みについて述べる。
VoCopilotは、エネルギー効率の良い音響ハードウェアとファームウェアと高度な機械学習モデルを組み合わせたエンドツーエンドシステムである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:46:52 GMT)
A predict-and-optimize approach to profit-driven churn prevention [1.0] 我々は,留保キャンペーンを顧客をターゲットとするタスクを,後悔の最小化問題として検討する。
提案手法は予測最適化(PnO)フレームワークのガイドラインと一致し,勾配降下法を用いて効率的に解ける。
結果は,他の確立した戦略と比較して,平均利益率で最高の平均性能を達成するアプローチの有効性を裏付けるものである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:37:32 GMT)
$\nu^2$-Flows: Fast and improved neutrino reconstruction in
multi-neutrino final states with conditional normalizing flows [1.0] $nu2$-Flowsは、$nu$-Flowsメソッドを複数のニュートリノを含むファイナルステートに拡張したものである。
推論時間は競合する手法よりも大幅に速く、グラフィック処理ユニット上で並列に評価することでさらに削減することができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:10:19 GMT)
Monoculture in Matching Markets [1.0] アルゴリズムのモノカルチャーは、多くの意思決定者が応募者を評価するために同じアルゴリズムに依存するときに生じる。
両面のマッチング市場において,アルゴリズムによるモノカルチャーの抽出可能な理論的モデルを導入する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:46:54 GMT)
Bayesian Metaplasticity from Synaptic Uncertainty [1.0] メタ可塑性とベイズ推論の原理に触発されたMetaplasticity from Synaptic Uncertainity (MESU)を紹介する。
MESUはシナプス不確実性を利用して情報を時間とともに保持し、その更新規則はシナプス更新のための対角線ニュートン法を密接に近似している。
明示的なタスク境界を必要とせずに100タスクにわたる学習性能を維持するMESUの際立った能力を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:06:10 GMT)
An Information-Flow Perspective on Algorithmic Fairness [1.0] 本研究は,アルゴリズムフェアネスとセキュア情報フローの概念との関係を考察することによって得られた知見を提示する。
フェアネススプレッドと呼ばれる新しい量的公正の概念を導出し、定量的情報フローを用いて容易に分析できる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:46:36 GMT)
IQNet: Image Quality Assessment Guided Just Noticeable Difference
Prefiltering For Versatile Video Coding [0.9] ジャストインタブル歪み(JND)による画像プリフィルタは、圧縮前に知覚的に冗長な情報をフィルタリングすることにより、視覚的に符号化効率を向上させる。
本稿では, 高精度なブロックレベルのJNDモデリングのための画像品質評価によって導かれる, きめ細かいJND事前フィルタリングデータセットを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:58:10 GMT)
Secret extraction attacks against obfuscated IQP circuits [0.9] 2008年、シェパードとブレムナーは、検証者が比較的簡単に実装できるIQP回路の族からユニタリを構成するプロトコルを提案した。
難題は難解な秘密を含むように設計されており、統計検査に変換できる。
カハナモク・マイヤーは、効率的な古典的秘密抽出攻撃を発見した。
Bremner氏、Cheng氏、Ji氏は最近、オリジナルのプロトコルを広範囲に一般化した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:08:35 GMT)
VDOO: A Short, Fast, Post-Quantum Multivariate Digital Signature Scheme [0.9] 多変量方程式の解法に基づく量子後デジタルシグネチャアルゴリズムを提案する。
我々は、慎重に選択されたパラメータが、既存のすべての最先端攻撃に抵抗できることを示します。
これは、同様のセキュリティを持つ全ての既知の量子後シグネチャスキームの中で最小のシグネチャサイズである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:58:10 GMT)
Learning of Hamiltonian Dynamics with Reproducing Kernel Hilbert Spaces [0.8] 本稿では,限られたデータ点からハミルトン力学を学習する手法を提案する。
学習力学はハミルトニアンであり、学習したハミルトニアンベクトル場は奇数あるいは偶数となることが示されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:19:48 GMT)
Beyond the Holographic Entropy Cone via Cycle Flows [0.8] ホログラフィックエントロピー円錐の外側のエントロピーベクトルを計算するための新しい処方則を導入する。
有向グラフ上のサイクルフローを利用することで、頂点の任意の部分集合に付随する最大サイクルフローが、サブシステムに対応するもので、明らかに浄化対称性に従うことを示す。
我々は、最大サイクルフローが部分加法と強部分加法の両方に従うことを証明し、それによって、その部分系に付随するエントロピーの候補として確立する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:00:00 GMT)
Teaching Quantum Computing using Microsoft Quantum Development Kit and
Azure Quantum [0.8] 本報告では,2022-23年度に東北大学で量子コンピューティングの大学院を修了した経験について述べる。
このコースは、実践的でソフトウェア駆動のアプローチを採用し、手動プログラミングの課題とソフトウェアにフォーカスした最終プロジェクトを通じて、基本的な量子概念とアルゴリズムを教える。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:37:14 GMT)
Developing Programming Assignments for Teaching Quantum Computing and
Quantum Programming [0.8] 本報告では、量子コンピューティングを実践的に教えるために使用できる様々なプログラミング課題について述べる。
これらの課題により、学習者は量子ソフトウェア開発プロセスのあらゆる段階において経験を積むことができる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:41:31 GMT)
A Tale of Unrealized Hope: Hardware Performance Counter Against Cache Attacks [0.8] 本稿では,ハードウェア性能カウンタ(HPC)を用いたキャッシュ側チャネル攻撃防御手法について検討する。
多数の提案と有望な報告結果により,提案手法が適切な設定で評価されるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:17:23 GMT)
ProCoT: Stimulating Critical Thinking and Writing of Students through
Engagement with Large Language Models (LLMs) [0.8] 我々は、ProCoT(Probing Chain of Thought)と呼ばれる新しい筆記法を導入する。
これは、学生がChatGPTのようなLarge Language Model (LLM)を使って不正行為をすることを防ぐと同時に、そのようなモデルを通じて活発に学習することを促進する。
約66名の学生を対象に,ProCoTを用いて2つのコースで研究を行った。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:01:46 GMT)
Estimating phase transition of perturbed J1-J2 Heisenberg quantum chain
in mixtures of ground and first excited states [0.7] 我々は、J1-J2ハイゼンベルク量子スピン鎖の基底状態と第1励起状態の混合における近傍の絡み合いが秩序パラメータとして利用できることを示した。
本研究では, 地中および第1励起状態間の相対混合確率の異なるシステムサイズに対する順序パラメータの有効性について検討した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:02:02 GMT)
Efficient quantum simulation of nonlinear interactions using SNAP and
Rabi gates [0.7] 非線形ボソニック力学を効率的にモデル化する決定論的シミュレーション手法を提案する。
提案手法は,高次ボゾン相互作用から生じる現象の高忠実度モデリングを容易にする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:44:43 GMT)
Demonstration of fault-tolerant Steane quantum error correction [0.7] 本研究では,複数ラウンドのフォールトトレラントSteane QECをトラップイオン量子コンピュータ上に実装する。
各種QEC符号を用い, フラグ量子ビットを用いた従来の実験手法と比較した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:32:49 GMT)
Reliable Probabilistic Classification with Neural Networks [0.7] Venn Prediction(VP)は、よく校正された確率予測を生成するための、新しい機械学習フレームワークである。
本稿では,ニューラルネットワーク(NN)に基づく5つのVP手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:23:25 GMT)
Precision Bounds on Continuous-Variable State Tomography using Classical
Shadows [0.5] 古典シャドウフレームワークにおける連続可変量子状態トモグラフィの実験プロトコルを再放送する。
我々は,ホモダイン,ヘテロダイン,光子数分解(PNR)および光子パリティプロトコルの効率を解析した。
数値的および実験的ホモダイン・トモグラフィーは 我々の限界を大きく上回る
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:41:42 GMT)
Exploration of new chemical materials using black-box optimization with
the D-wave quantum annealer [0.4] 材料情報学では、化学空間の広大なため、望ましい性質を持つ化学物質を探すことは困難である。
実際には、容易に合成可能な構成を提案する必要もある。
本稿では,物質探索における個別変数を含むブラックボックス目的関数の最適化について述べる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:06:21 GMT)
Dementia Assessment Using Mandarin Speech with an Attention-based Speech
Recognition Encoder [0.4] 本稿では,マンダリン話者に適した認知症評価システムを構築するために,音声認識モデルを利用する。
99名の被験者からマンダリン音声データを収集し, 地域病院から臨床評価を得た。
アルツハイマー病の診断では92.04%の精度で, 平均絶対誤差は9%であった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:07:44 GMT)
Exploring the Feasibility of Generating Realistic 3D Models of
Endangered Species Using DreamGaussian: An Analysis of Elevation Angle's
Impact on Model Generation [0.4] 本研究の目的は,絶滅危惧動物における一貫した,現実的な3次元モデル作成の実現可能性について,限られたデータを用いて検討することである。
本稿では3次元モデル生成における標高角と出力品質の関係について検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:56:07 GMT)
SoloPose: One-Shot Kinematic 3D Human Pose Estimation with Video Data
Augmentation [0.4] SoloPoseは、ビデオのキネマティックな3Dポーズ推定のための、ワンショットで多対多の時間変換モデルである。
HeatPoseはガウス混合モデル分布に基づく3次元熱マップであり、キーポイントだけでなくキーポイントを標的にしている。
3D AugMotion Toolkitは、既存の3D人間のポーズデータセットを拡張するための方法論である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:45:04 GMT)
Healthcare Policy Compliance: A Blockchain Smart Contract-Based Approach [0.3] HIPAAのような厳格な規制にもかかわらず、ポリシーコンプライアンスの重大なギャップは、データ漏洩が起きるまで検出されないことが多い。
このギャップを埋めるため、ブロックチェーンを利用したスマートコントラクトベースのアクセス制御モデルを提案する。
弊社のアプローチでは、インフォームドコンセントのコンポーネントをPPAに統合し、ブロックチェーンのスマートコントラクトを使用してポリシの実施を自動化する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 21:25:07 GMT)
Topological atom optics and beyond with knotted quantum wavefunctions [0.3] 原子光学はコヒーレント物質波による光学現象を示し、光と物質の間に基礎的なつながりを与える。
我々は、非自明な位相を示すスピノル・ボース=アインシュタイン凝縮体における結び目付き量子波動関数を作成する。
本稿では,多成分原子系の対称性と基礎となるトポロジとの顕著な関係を実証する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:02:07 GMT)
Integrating AI and Learning Analytics for Data-Driven Pedagogical
Decisions and Personalized Interventions in Education [0.3] 本研究は,革新的な学習分析ツールの概念化,開発,展開について考察する。
本ツールは,学生のエンゲージメントの定量化,学習進行のマップ化,および多様な指導戦略の有効性の評価を目的としている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:00:26 GMT)
Evaluation of semantic relations impact in query expansion-based
retrieval systems [0.3] 本稿では,与えられた分類のラベルを情報源として資源を生成する。
得られたリソースは、一連の入力クエリをインテントとして再構成するプレーン分類器に統合される。
この評価は、多種多様な分類をユースケースとして採用し、そのラベルを意味的拡張の基礎として利用している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:44:33 GMT)
Concise Fuzzy Planar Embedding of Graphs: a Dimensionality Reduction
Approach [0.3] グラフ表現を$k$次元空間にマッピングし、主にユークリッド距離を測定することによって近隣ノードの問い合わせに答える。
答えの正確さは低下するが、ファジィ論理によって補償される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:04:22 GMT)
Stability of the spectral gap and ground state indistinguishability for
a decorated AKLT model [0.3] AKLTモデルに対する有限体積基底状態の局所的不明瞭性を確立するためにクラスター展開を用いる。
我々の推定では、このモデルは局所的位相量子秩序(LTQO)を満たすため、基底状態上のスペクトルギャップは局所的摂動に対して安定である。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:26:04 GMT)
Exploring Gender Disparities in Bumble's Match Recommendations [0.3] インドにおけるオンラインデートプラットフォームであるBumbleの文脈において、偏見と差別について研究している。
我々は,Bumbleがユーザにプッシュするアルゴリズムにおいて,バイアスの存在を特定し,対処する実験を行う。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:09:42 GMT)
Unsupervised and Supervised learning by Dense Associative Memory under
replica symmetry breaking [0.2] マルチノード相互作用を持つヘビアン誘引ネットワークは、多くのタスクにおいて古典的なペアワイズよりも優れていることが示されている。
我々はこれらの連想記憶のための教師あり教師なし学習プロトコルの1段階の分解-複製-対称性図を導出する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:27:46 GMT)
Comparing Quantum Service Offerings [0.2] 異なるハードウェア技術に基づくいくつかのデバイスを比較し、異なる製品を通じて提供します。
実験から学んだ教訓を文書化することにより、量子特化製品の使用をシンプルにすることを目指している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:14:12 GMT)
Prompting LLMs with content plans to enhance the summarization of
scientific articles [0.2] 我々は要約システムを導くためのプロンプト手法を考案し、実装し、評価する。
記事から抽出したキーワードのリストを要約する。
結果,特に分割を個別に要約する小さなモデルでは,性能が向上した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:28:10 GMT)
Probabilistic error cancellation for dynamic quantum circuits [0.2] 本研究は,PECの単元回路から計測に基づく動的回路への応用を拡張したものである。
提案手法は,超伝導プロセッサにおける非局所測定クロストークを考慮に入れながら,疎いパウリ・リンドブラッドノイズモデルから計測に基づく操作まで拡張する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:33:09 GMT)
Quantum Financial Modeling on Noisy Intermediate-Scale Quantum Hardware:
Random Walks using Approximate Quantum Counting [0.1] 従来の量子カウンティングよりもはるかに少ない2ビットのエンタングルゲートを用いた量子近似カウンティング回路を導入する。
この結果と株価指数の値変化分布を比較し, 量子回路の挙動と中間測定の有無を住宅市場の傾向と比較した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:15:20 GMT)
Vertical Federated Alzheimer's Detection on Multimodal Data [0.0] 分散データからトレーニングできるHIPAA準拠のフレームワークを紹介します。
次に,アルツハイマー病検出のための多モード垂直フェデレーションモデルを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:09:04 GMT)
Variational excess risk bound for general state space models [0.0] 一般状態空間モデルに対する変分オートエンコーダ(VAE)について検討する。
本稿では, 変動分布の逆因数分解について検討し, VAEに関連する余剰リスクを解析する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:41:07 GMT)
Topological nonlocal operations on toroidal flux qubits [0.0] システムを2つ以上のフラックス量子ビットにスケーリングすると、その間に創発的なフィールドフリー結合が生じる。
このシステムのトポロジカル・非局所的な側面は量子情報に深く応用できることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 01:04:18 GMT)
Tight lower bounds on the time it takes to generate a geometric phase [0.0] 循環的に進化する量子系の進化時間は、系のエネルギー資源と状態によって獲得される幾何学的位相によって制限されることを示す。
所定のアハロノフ・アナダン幾何位相を生成するのに必要な時間に基づいて、3つの厳密な下界を導出し、検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:33:19 GMT)
The Spectrum of Asymptotic Cayley Trees [0.0] ケイリー木と同一の連続スペクトルが存在し、一般に空でない純粋点スペクトルが存在することを示す。
純粋点スペクトルが空でない場合、ウォークは一般に非ゼロ確率で制限される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:40:03 GMT)
The Physics-Informed Neural Network Gravity Model: Generation III [0.0] 本稿では,物理インフォームドニューラルネットワーク重力モデル(PINN-GM-III)の第3世代を紹介する。
誤差補間、低高度サンプルへの偏り、高高度での数値不安定性、および準拠境界条件の問題を解く。
既知の不均一密度小惑星をモデル化し、その性能を7つのコアメトリクスを用いて評価する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:17:06 GMT)
Technical Report: Unresolved Challenges and Potential Features in EATXT [0.0] この文書は、EATXTに追加される可能性のある潜在的な高度な機能を記述する技術的レポートである。
本報告の目的は、関連する技術的課題の理解を共有し、潜在的に関心のある仲間を支援することである。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:45:17 GMT)
Taxonomy-based CheckList for Large Language Model Evaluation [0.0] 我々は、自然言語の介入に人間の知識を導入し、事前訓練された言語モデル(LM)の振る舞いを研究する。
CheckListの振る舞いテストに触発されて,LMの非倫理的行動の探索と定量化を目的としたチェックリストスタイルのタスクを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:58:07 GMT)
Symplectic Autoencoders for Model Reduction of Hamiltonian Systems [0.0] 長期の数値安定性を確保するためには,システムに関連するシンプレクティックな構造を維持することが重要である。
本稿では,次元削減のための確立されたツールであるオートエンコーダの精神の中で,新しいニューラルネットワークアーキテクチャを提案する。
ネットワークのトレーニングには,非標準勾配降下法を適用した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:20:25 GMT)
Symmetry-preserving and gate-efficient quantum circuits for quantum
chemistry [0.0] 量子アルゴリズムは、量子デバイス上での電子状態の正確な表現を必要とする。
現在の近似は、化学的精度とゲート効率を組み合わせるのに苦労している。
本稿では, 化学的に正確な分子エネルギーを提供する, スピン対称性を保ち, ゲート効率のアンザッツについて述べる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:01:48 GMT)
Symbolic Regression of Dynamic Network Models [0.0] ネットワーク生成器の新たな定式化とパラメータフリー適合関数を導入し、生成されたネットワークを評価する。
我々は、時間変化ネットワークのルールを作成し、検索するためにジェネレータのセマンティクスを変更することで、このアプローチを拡張した。
このフレームワークは、主要都市の地下鉄ネットワーク、ストリートネットワークの地域、人工知能における文学のセマンティック共起ネットワークの3つの経験的なデータセットで使用された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 00:34:45 GMT)
Steered quantum coherence and quantum Fisher information in spin-chain
system [0.0] ステアド量子コヒーレンス, ステアドコヒーレンスの相対エントロピー, ギブス状態の2キュービット$XXZ$系の量子フィッシャー情報について検討する。
温度, 外部磁場, 相互作用強度の変動を解析した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:45:24 GMT)
Small jet engine reservoir computing digital twin [0.0] ジェットカート P100-RX ジェットエンジンのデジタル双発機は実験データのみを用いて開発された。
このモデルは、動的システムのための最良クラス機械学習アルゴリズムである次世代貯水池コンピュータを用いて訓練された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:41:51 GMT)
Small Bird Detection using YOLOv7 with Test-Time Augmentation [0.0] 本研究では,スポッティングバード2023の小型物体検出問題に対する小鳥検出の改良を目的とした手法を提案する。
提案手法では,入力解像度の向上,マルチスケール推論の導入,推論プロセス中のフリップ画像の考察,重み付きボックス融合による検出結果のマージを行う。
IoU=0.5でパブリックAPが0.732、プライベートAPが27.2であった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 00:11:49 GMT)
Simulation of quantum optics by coherent state decomposition [0.0] 我々は、系をコヒーレント状態の有限ランク(項数)重ね合わせに分解することで量子光学をシミュレートする枠組みを導入する。
我々は、最初に同じモードで$n$の光子を持つ線形光学シミュレーションは、$O(m2 n)$のように効率よくスケールすることを示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:26:22 GMT)
Safeguarding the safeguards: How best to promote AI alignment in the
public interest [0.0] 我々は、AIアライメントの取り組みを支援する俳優が、これらの取り組みをできるだけ効果的にすることを支援することを目指している。
我々は、アライメントの取り組みが非生産的になり、大規模なAIリスクが増大する可能性のある4つの問題を述べる。
我々は、公共の利益で行動しようとする機関は、アライメントの取り組みを効果的にする方法を体系的に考えるべきだというより広範な勧告を行う。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:55:48 GMT)
Review of Unsupervised POS Tagging and Its Implications on Language
Acquisition [0.0] 人間の構文知識の根底にある能力は、どの単語が類似した構造に現れるかを決定することである。
このプロセスの探索では、子どもと同じような目標を持つ様々な工学的アプローチについて検討する。
モデルの発展と言語習得との関連性を支持する共通テーマについて論じる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:31:00 GMT)
Resonance states of the three-disk scattering system [0.0] 共振状態は2つの因子からなると主張する開カオス系の最近の予想を証明する。
特に、一因子が普遍指数分布の強度ゆらぎによって与えられることを実証する。
他の因子は共鳴状態の寿命に依存する古典的な密度であると考えられており、古典的な構成によって非常によく説明されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:09:04 GMT)
Relations between Markovian and non-Markovian correlations in multi-time
quantum processes [0.0] 我々は、高度に非マルコフ過程でさえ、十分な数のステップがある場合、最大で完全な相関を持つように任意に近づくことを発見した。
これは、高度に非マルコフ過程でさえ、十分に多くのステップがある場合、最大で完全な相関を持つような任意に近いかもしれないことを意味する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:00:20 GMT)
Realizing Altermagnetism in Fermi-Hubbard Models with Ultracold Atoms [0.0] オルター磁性は、強磁性と従来の反強磁性とは異なる新しいタイプのコリニア磁性を示す。
我々は,光格子中の超低温フェルミオン原子を用いて,d波の反磁性相をどうやって実現できるかを理論的に示す。
異方性スピン輸送(異方性スピン輸送)という反磁性の定義された特性の1つは、トラップ膨張実験(英語版)によって探究できる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:01:20 GMT)
Probabilistic learning of the Purkinje network from the
electrocardiogram [0.0] 非侵襲的臨床データからPurkinjeネットワークを同定するための確率論的アプローチを提案する。
心電図を用いて解剖学的に正確な心室モデルを構築した。
生理的心電図を高速モデルでシミュレートする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:34:29 GMT)
Pipeline and Dataset Generation for Automated Fact-checking in Almost
Any Language [0.0] 本稿では,公開言語モデルとデータを活用したファクトチェック自動化パイプラインを提案する。
パイプラインは,エビデンス検索とクレームの妥当性評価という,2つの主要なモジュールで構成されている。
チェコ語、英語、ポーランド語、スロバキア語パイプラインのすべてのデータと微調整されたモデルにオープンアクセスを提供しています。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:43:41 GMT)
Personality testing of GPT-3: Limited temporal reliability, but
highlighted social desirability of GPT-3's personality instruments results [0.0] 本研究は、著名なAIボットの性格プロファイルの時間的信頼性を評価することを目的とする。
ダヴィンチ003は、特にコミュニオンの領域において、社会的に望ましい社会人格のプロファイルを示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 06:26:05 GMT)
Path integral for the quartic oscillator: A simple analytic expression
for the partition function [0.0] path-integral法は、クォート発振器の分割関数に対する単純なパラメータフリーな式を導出するために用いられる。
新しい表現は、温度と結合強度の全範囲において、自由エネルギーを数パーセント精度良くする。
我々の単純な式は、ファインマンとクラインナートとB'uttnerとFlytzanisによって提案された近似分割関数と比較される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:05:03 GMT)
Pareto Envelope Augmented with Reinforcement Learning: Multi-objective
reinforcement learning-based approach for Large-Scale Constrained Pressurized
Water Reactor optimization [0.0] PEARLは、従来のポリシーに基づく多目的強化学習法とを、単一のポリシーを学習することで区別する。
ディープラーニングと進化的テクニックにインスパイアされたいくつかのバージョンが作成され、制約のない問題ドメインと制約のない問題ドメインの両方に対応している。
2つの実用的PWRコアローディングパターン最適化問題を用いて実世界の応用性を実証した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:41:09 GMT)
One Self-Configurable Model to Solve Many Abstract Visual Reasoning
Problems [0.0] 本稿では,単一階層抽象視覚推論タスクを解くための統一モデルを提案する。
提案したモデルはSCAR-Aware dynamic Layer (SAL)に依存しており、この問題の構造に重みを適応させる。
実験により、SALベースのモデルは、一般的に、様々なタスクを効果的に解決し、その性能は最先端のタスク固有のベースラインと同等であることが示された。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:15:20 GMT)
On the testability of the K\'arolyh\'azy model [0.0] K'arolyh'azy の当初の提案は、時空のゆらぎが宇宙のデコヒーレンスの原因になり得ることを示唆していたが、予想外の放射線の放出のために大きな課題に直面した。
我々は、計量揺らぎが波動方程式に従わなければならないというK'arolyh'azyの仮定を再評価した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:11:29 GMT)
On randomized estimators of the Hafnian of a nonnegative matrix [0.0] 非負の正方行列のハフニアンに対する2つの近似アルゴリズムの性能について検討する。
ほとんどの場合、ゴッドシル・ガットマン推定器ははるかに優れた精度を提供する。
相対分散 $sigma / mu$ がグラフの大きさの平方根として大きくなることを解析的に示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:00:07 GMT)
On a Functional Definition of Intelligence [0.0] 合意されたインテリジェンスの定義がなければ、"このシステムはインテリジェントか?
知性(intelligence)とは、哲学、心理学、認知科学の分野である。
我々は、その知性が実際に達成される方法とは異なる、純粋に機能的でブラックボックスな知性の定義について論じる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:46:49 GMT)
NeuroFlow: Development of lightweight and efficient model integration
scheduling strategy for autonomous driving system [0.0] 本稿では,自動車システムの独特な制約と特性を考慮した自律運転システムを提案する。
提案システムは、自律運転における複雑なデータフローを体系的に分析し、ディープラーニングモデルに影響を与える様々な要因を動的に調整する機能を提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 07:51:20 GMT)
Multipartite Two-partite Quantum Correlation and Its Three Types of
Measures [0.0] MQC(Multipartite quantum correlation)は、多くの新しい微視的およびマクロ的な量子現象を説明できるだけでなく、優れた特定の量子技術にも期待できる。
直感的で明快な物理画像を提供する多部構成の2部構成QCを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:23:06 GMT)
Many-body origin of anomalous Floquet phases in cavity-QED materials [0.0] 異常なフロケ位相位相は、周期的に駆動される系の静的なアナログを持たないホールマークである。
量子浮動小数点工学は空洞QED材料に対する興味深いアプローチとして登場した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:00:05 GMT)
Magnon Bose-Einstein condensates: from time crystals and quantum
chromodynamics to vortex sensing and cosmology [0.0] マグノンはボース=アインシュタイン凝縮体(英語版)(BEC)を形成し、スピンはグローバルなコヒーレントな位相で進行する。
3ドルHeの超流動相は、コヒーレントマグノン物理学のためのほぼ理想的なテストベンチを提供する。
本総説では, 基礎物理現象研究におけるマグノンBECの応用の最近の進歩を概説する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:49:28 GMT)
Machine-Learned Exclusion Limits without Binning [0.0] 我々は、1次元信号と背景確率密度関数を抽出するためにカーネル密度推定器(KDE)を含むMLL法を拡張した。
本手法は,レプトン対に崩壊するエキゾチックヒッグス粒子の探索と,レプトン対に崩壊するZ'$ボソンの2例に適用する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:40:58 GMT)
Low-resource classification of mobility functioning information in
clinical sentences using large language models [0.0] 本研究は,臨床ノートから機能的情報の存在を正確に識別する,公開可能な大規模言語モデル(LLM)の能力を評価するものである。
我々は,n2c2臨床ノートから算出したモビリティNERデータセットから,1000文のバランスの取れたバイナリ分類データセットを収集した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:59:17 GMT)
Local coherence by thermalized intra-system coupling [0.0] エネルギー固有状態の量子重ね合わせは、低温の熱浴と結合した単一の量子2レベルシステムに自律的に現れる。
本稿では,グローバルギブズ状態に熱化される2レベルシステム間の工学的相互作用を利用した,より実現可能なアプローチを提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 12:51:51 GMT)
Latent Diffusion Models with Image-Derived Annotations for Enhanced
AI-Assisted Cancer Diagnosis in Histopathology [0.0] 本研究では,自動抽出画像特徴量から構造化テキストプロンプトを構成する手法を提案する。
画像由来の特徴は, 健康なラベルや癌ラベルに限らず, Fr'echet Inception Distance (FID) を178.8から90.2に改善した。
また、病理学者は合成画像の検出が困難であり、中央値の感度/特異度は0.15/0.55であることを示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:48:55 GMT)
Integrating New Technologies into Science: The case of AI [0.0] 我々は、科学者の人的資本と、協力者や機関のネットワークで利用可能な外部リソースに焦点をあて、科学研究におけるAIの統合について研究する。
AIの普及は、テクノロジーを補完する人的資本の展開と創出を組織する社会的メカニズムによって強く推進されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:49:13 GMT)
Information Extraction from Unstructured data using Augmented-AI and
Computer Vision [0.0] 情報抽出(IE)プロセスは、構造化されていないデータやラベルのないデータから意味のある情報を抽出するためにしばしば用いられる。
本稿では,A2Iとコンピュータビジョン技術を用いた情報抽出手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:27:41 GMT)
Incorporating Season and Solar Specificity into Renderings made by a
NeRF Architecture using Satellite Images [0.0] 我々は、NeRFベースのフレームワークを使用して、季節ごとにレンダリングを作成できる方法を示す。
NeRFは、視角と太陽角とは無関係に季節的な特徴を表現できるが、それでも影を描画できる。
我々は,Maxar WorldView-3衛星が撮影した画像を含む8つのエリア・オブ・関心事におけるネットワークの性能を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:33:17 GMT)
Image Deblurring using GAN [0.0] 本研究は,GAN(Generative Adversarial Network)の画像処理への応用に焦点を当てた。
プロジェクトはGANモデルのインフローを定義し、GoPROデータセットでトレーニングする。
ネットワークは画像のシャープなピクセルを取得でき、平均29.3ピーク信号対雑音比(PSNR)と0.72構造類似度評価(SSIM)を実現している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 02:43:30 GMT)
Hybrid Paul-optical trap with large optical access for levitated
optomechanics [0.0] 我々は高真空中における荷電ナノ粒子の浮揚を可能にするハイブリッドトラッププラットフォームを提案する。
我々は、ポールトラップを安全ネットとして使用し、高真空下で光トラップから失われた粒子を回収する制御された転送手順を詳述する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:11:52 GMT)
Human Perception-Inspired Grain Segmentation Refinement Using
Conditional Random Fields [0.0] 本稿では,粒界接続に関する領域知識を活用し,高速かつ高忠実な後処理手法を提案する。
ポリ結晶酸化物の電子顕微鏡画像上でのU-Netモデルによる検証において,79%のセグメント識別精度を実現する。
新規な粒状アライメント指標を導入し, 粒状アライメントの51%向上を示した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:26:01 GMT)
Heat radiation and transfer in the presence of a cylinder [0.0] 無限長シリンダーの存在下でのナノ粒子の熱放射と放射熱伝達について検討した。
単一粒子の熱放射はナノワイヤに近接させて増強することができる。
シリンダーに沿った熱伝達は空の真空よりもはるかに遅く崩壊する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 11:42:02 GMT)
GreenLightningAI: An Efficient AI System with Decoupled Structural and
Quantitative Knowledge [0.0] 強力な、人気のあるディープニューラルネットワークのトレーニングには、非常に高い経済的および環境的コストが伴う。
この作業は、GreenLightningAIを提案することによって、根本的に異なるアプローチを取る。
新しいAIシステムは、所定のサンプルに対してシステムサブセットを選択するために必要な情報を格納する。
我々は,AIシステムを新しいサンプルで再学習する際に,構造情報を無修正で保持できることを実験的に示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:34:11 GMT)
Generalization despite overfitting in quantum machine learning models [0.0] 量子モデルにおける良性過剰適合のキャラクタリゼーションを提供する。
量子モデルのクラスが如何に類似した特徴を示すかを示す。
我々はこれらの特徴を、局所的な「スパイク」な振る舞いでノイズデータを補間する量子モデルの能力に応じて直感的に説明する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 00:43:11 GMT)
General monogamy and polygamy relations of arbitrary quantum
correlations for multipartite systems [0.0] 一般のモノガミー関係は、量子相関のパワーの$alpha$th $(0leqalpha leqgamma$, $gammageq2)$に対して提示される。
一般的なポリガミー関係は、量子相関のパワーの$beta$th $(betageq delta$, $0leqdeltaleq1)$に対して与えられる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:29:30 GMT)
GPT-4 Surpassing Human Performance in Linguistic Pragmatics [0.0] 本研究では,Large Language Models (LLMs) の言語プラグマティクスの理解と解釈能力について検討した。
Grice のコミュニケーション原理を用いて,LLM とヒトの被験者を対話型タスクに対する応答に基づいて評価した。
以上の結果より, LLM, 特にGPT4は, 実用的解釈において, 人体よりも優れていた。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 05:40:15 GMT)
Further improving quantum algorithms for nonlinear differential
equations via higher-order methods and rescaling [0.0] 本稿では,Carleman線形化法に基づく既存量子アルゴリズムの3つの改良点について述べる。
線形化微分方程式の解法として高精度な手法を用いることで,誤差の対数的依存性と時間的近線形依存性を実現する。
再スケーリング技術はコストを大幅に削減し、そうでなければODEのシステムに対するCarleman順序で指数関数的になる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 03:52:44 GMT)
Frame representations of qudit quantum mechanics [0.0] 四重項に対してウィグナー関数を定義する試みは数多くあり、それぞれにその利点と制限がある。
連続バージョンはより複雑な定義を持つが、元のウィグナー関数と類似しており、量子状態の可視化を可能にする。
強フレームの概念に基づくバージョンは有限であるが、連続バージョンと同様の性質と応用がある。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:29:05 GMT)
Failures of the Feynman-Dyson diagrammatic perturbation expansion of
propagators [0.0] 電子プロパゲータとしての一粒子多体グリーン関数のファインマン・ダイソン図形摂動膨張の3つの病理学的挙動を数値的に記述する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:39:33 GMT)
Failure Artifact Scenarios to Understand High School Students' Growth in
Troubleshooting Physical Computing Projects [0.0] 物理コンピューティングプロジェクトは、学際的な問題解決を理解するためのリッチなコンテキストを提供する。
発見: 学生は、より特定性の高いバグを識別し、ドメインを横断し、バグの複数の原因を考慮し、改善した。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:14:48 GMT)
Extrapolation of polaron properties to low phonon frequencies by
Bayesian machine learning [0.0] 正確な量子計算の実現可能性はしばしば、数値計算に必要な切り離されたヒルベルト空間の次元性によって制限される。
本研究は,効果的に低次元ヒルベルト空間における量子特性を用いたベイズ機械学習(ML)モデルを実証する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:04:41 GMT)
Exploring Automatic Text Simplification of German Narrative Documents [0.0] 現在、テキストの単純化に利用可能なドイツのデータセットはわずかである。
本稿では,現代のNLG技術がドイツ語の物語テキストの単純化にどの程度応用できるかを考察する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:10:44 GMT)
Exact Algorithms and Lowerbounds for Multiagent Pathfinding: Power of
Treelike Topology [0.0] 我々は、与えられたグラフの$G上の一組の$kエージェントの経路を効率的に見つけることに重点を置いており、各エージェントはそのソースからターゲットへの経路を求める。
解の質の重要な尺度は提案されたスケジュールの長さ$ell$、すなわち最長経路の長さである。
MAPFは$G$+$ell$に対してW[1]ハードであり、FPTは$G$+$ell$であることを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:42:46 GMT)
Entanglement entropy of two disjoint intervals and spin structures in
interacting chains in and out of equilibrium [0.0] 我々は、相互作用するスピン鎖のパラダイム、ハイゼンベルクスピン-$frac12$ XXZ モデルを参照系とする。
例えば、空隙のない XXZ ハミルトニアンのフェルミオン類似体は、連続的なスケーリング極限において、質量のないチューリングモデルによって記述される。
スピンブロックのエントロピーを用いて、基礎となる無質量チューリングモデルのスピン構造を明らかにする方法を示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 18:49:23 GMT)
Eliminating the "impossible": Recent progress on local measurement
theory for quantum field theory [0.0] 量子場理論(QFT)における測定結果について検討する。
本稿では,QFTの計測基準を定式化し,その「不可能な測定」問題に対する応答を解析するための3つのアプローチについて検討する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:44:56 GMT)
Effects of Chromatic Dispersion on Single-Photon Temporal Wave Functions
in Quantum Communications [0.0] 量子通信における単一光子の時間波関数(TWF)に対する色分散の影響について検討する。
チャープパラメータを適切に調整することにより,色分散の抑制効果を補償できることを示す。
本研究では,高速・長距離量子通信システムの設計と実装に関する重要な知見を提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:00:06 GMT)
Dynamics of Quantum Coherence and Quantum Fisher Information of a V-type
Atom in Isotropic Photonic Crystal [0.0] 自由空間に埋め込まれたV型3レベル原子の時間進化、量子コヒーレンス、非マルコフ性について検討した。
フォトニックバンドギャップ結晶は、構造された環境として、これらの量子的特徴の保存と強化に大きな影響を与えることが示されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:23:04 GMT)
Dynamical Casimir cooling in circuit QED systems [0.0] 外部駆動型超伝導量子干渉装置(SQUID)に結合された伝送線路は、動的カシミール効果(DCE)を示すことができる。
我々は、SQUIDの自由度を定量化し、キャビティモードとハミルトンの3体相互作用をもたらすことを示す。
この設定により, キャビティ内に存在する全てのモードとの結合が可能となり, SQUIDとの相互作用に他の2つのモードを追加することにより, 冷却効果が向上することを示す。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:42:07 GMT)
Dynamic Hysteresis Across a Dissipative Multi-Mode Phase Transition [0.0] マルチモード駆動散逸系における第1次散逸相転移のスイープを実験的に検討した。
従来の研究とは対照的に, 駆動強度ではなく, 消散強度のスイープを行う。
本研究では, 消散強度の走査と駆動強度の走査の違いを同定し, 議論する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:51:56 GMT)
Distributed Matrix-Based Sampling for Graph Neural Network Training [0.0] 本稿では,スパース行列乗算(SpGEMM)としてサンプリングを表現し,複数のミニバッチを同時にサンプリングする行列ベースバルクサンプリング手法を提案する。
入力グラフトポロジが1つのデバイスに収まらない場合、このグラフを分散し、通信回避型SpGEMMアルゴリズムを用いてGNNミニバッチサンプリングをスケールする。
新しいサンプリング法に加えて,分散GNNトレーニングにおける特徴抽出の現在の手法よりも,単純なオール・ツー・オール交換で特徴データを任意に複製できることが示される。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:52:34 GMT)
Distributed Learning of Mixtures of Experts [0.0] 私たちは、自然に分散されたデータセットや、計算を分散する潜在的に大きなデータセットを扱います。
本研究では,データ分散サブセットに並列に適合する局所的推定器から還元推定器を構築するために,専門家(MoE)モデルとアグリゲーション戦略を併用した分散学習手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:26:13 GMT)
Disorder-induced decoupling of attracting identical fermions: transfer
matrix approach [0.0] 一対の同一フェルミオンと有限格子クラスター上の短距離魅力的な相互作用を、強サイト障害の存在下で考慮する。
スピンフルフェルミオンは最小のエネルギーを持つ部位を同時に占有できるため、常に障害に耐性のある境界状態を形成するが、同じフェルミオンの場合、隣り合う場所でのペアリングの確率は相互作用と障害の関係に依存する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:59:41 GMT)
Directed Acyclic Graph Based Blockchain Systems [0.0] 我々は、従来のDAGベースのブロックチェーンとDAGベースのブロックチェーンの両方の制限について議論し、DAGベースのブロックチェーンをいつ好むかを提案する。
IOTA,NxT,Byteball,Nano,DAGCoin,Fantom,XDAG,Caixapayなどを含むDAGに基づくブロックチェーン実装の比較分析を行った。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 14:16:14 GMT)
Deep Reinforcement Learning for Joint Cruise Control and Intelligent
Data Acquisition in UAVs-Assisted Sensor Networks [0.0] 無人航空機(UAV)補助センサーネットワーク(UASNets)は、世界中の民間用途において大きな成長を遂げている。
これらのシナリオにおける大きな課題の1つは、UAVの動きがチャネル条件に影響を与え、パケット損失をもたらすことである。
提案手法は,複数のUAVの速度制御とデータ収集スケジュールを協調的に最適化することにより,パケット損失を最小化する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:04:03 GMT)
Deep Generative Models for Detector Signature Simulation: An Analytical
Taxonomy [0.0] 粒子物理学検出器からの信号は衝突の物理を符号化する低レベル物体である。
検出器におけるそれらの完全なシミュレーションは、メモリとストレージ集約的なタスクである。
この計算ボトルネックに対処するため,"Fast Simulation"が長年にわたって導入され,洗練されてきた。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 08:27:39 GMT)
Data and Approaches for German Text simplification -- towards an
Accessibility-enhanced Communication [0.0] 本稿では,ドイツ語テキストの簡易化の現状を考察し,並列化と単言語的ドイツ語コーパスに着目した。
ドイツのテキストを単純化するためのニューラルネットワークモデルをレビューし、法的テキストとアクセシビリティ要件に対するそれらの適合性を評価する。
著者らは2023年4月にこれらの研究ギャップに対処するため、学際的なOPEN-LSプロジェクトを立ち上げた。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:23:33 GMT)
DHFormer: A Vision Transformer-Based Attention Module for Image Dehazing [0.0] ぼんやりとした条件で取得された画像は、それらによって引き起こされる劣化を生じさせる。
ハウズの効果を緩和し、ヘイズフリーな画像を生成するために、事前ベースおよび学習ベースのアプローチが提案されている。
本稿では,アテンションモジュールにおける残差学習と視覚変換を用いた手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:05:32 GMT)
DC3DCD: unsupervised learning for multiclass 3D point cloud change
detection [0.0] 本稿では,DC3DCD(Deep 3D Change Detection)と呼ばれる教師なしの手法を提案する。
本手法は,画像分類のためのDeepClusterアプローチに基づいて,複雑な生の3DPCを扱う。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:48:54 GMT)
Cryptanalysis of PLWE based on zero-trace quadratic roots [0.0] 提案したPLWE問題に対する2つの攻撃(Y. Elias, K. E. Lauter, E. Ozman, K. E. Stange)を拡張する。
我々の攻撃は、根の痕跡がゼロであり、入力として取られたサンプル数の関数として圧倒的な成功確率を持つという事実を生かしている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 16:22:59 GMT)
Compiler Testing With Relaxed Memory Models [0.0] 並列プログラムのためのT'el'echatコンパイラテストツールを提案する。
T'el'echatは並列C/C++プログラムをコンパイルし、ソースとコンパイルされたプログラムの振る舞いを比較する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:02:39 GMT)
Classical Sorting Algorithms as a Model of Morphogenesis: self-sorting
arrays reveal unexpected competencies in a minimal model of basal
intelligence [0.0] 生物形態形成のモデルとしての選別アルゴリズムとその能力について検討する。
自動的な要素の配列は、エラー発生時に従来の実装よりも確実に、堅牢にソートできることを示す。
単純で親しみやすいアルゴリズムによる創発的問題解決能力の発見は、ディバース・インテリジェンス(Diverse Intelligence)の分野に新しい視点をもたらした。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 20:11:16 GMT)
Celestial Machine Learning: From Data to Mars and Beyond with AI Feynman [0.0] 機械やアルゴリズムは、ケプラーの最初の法則を天文観測だけで発見または学習できるのか?
ヨハネス・ケプラー(Johannes Kepler)による火星の軌道の方程式とルドルフの表を、物理学に触発された記号回帰の道具であるAI Feynmanを用いてエミュレートした。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:12:49 GMT)
Building symmetries into data-driven manifold dynamics models for
complex flows [0.0] ナヴィエ・ストークス方程式の対称性を利用して、長時間の力学が居住する多様体を見つける。
この枠組みをカオス的バースト状態における2次元コルモゴロフ流れに適用する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:05:21 GMT)
Bayesian Characterization and Identifiability of Multilevel Quantum
Systems [0.0] クォート系の量子特性評価のためのオンラインベイズ的手法を提案する。
パラメータの点推定を行うほとんどの評価プロトコルとは異なり、提案手法は確率分布を推定することができる。
モデルパラメータの理論的同定可能性の数学的証明と,パラメータが同定可能な量子状態に関する条件を提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 22:02:54 GMT)
Autoregressive fragment-based diffusion for pocket-aware ligand design [0.0] AutoFragDiffはフラグメントベースの自己回帰拡散モデルであり、ターゲットタンパク質構造に条件付けられた3D構造を生成する。
我々は、分子足場とタンパク質ポケットに固定された新しい分子断片の原子タイプと空間座標を予測するために幾何学的ベクトルパーセプトロンを用いる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 04:03:03 GMT)
Automating reward function configuration for drug design [0.0] 本稿では,実験データのみに依存する自動報酬設定のための新しい手法を提案する。
提案アルゴリズムは,人間の定義した関数の精度を予測的に上回る報酬関数を生成する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 15:09:16 GMT)
Asset Ownership Identification: Using machine learning to predict
enterprise asset ownership [0.0] この研究は、機械学習アルゴリズムを使って資産の所有者を予測する最良の分類モデルを決定する。
Adaboostは5%以下の低いテストエラーで全オーナーでベストを尽くしたが、Naive Bayesは最悪だった。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 23:51:13 GMT)
An artificial neural network approach to finding the key length of the Vigenère cipher [0.0] 我々は,ビジネア暗号の鍵長を決定するための古典的手法と近代的手法を組み合わせた人工ニューラルネットワーク(ANN)を作成する。
幅広いパラメータに対するモデルの精度を裏付ける実験的なエビデンスを提供する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 17:06:44 GMT)
A prescriptive method for fibre polarisation compensation in two bases [0.0] 単一モード光ファイバーは、光伝搬中にランダムな偏光回転を引き起こす、小さいが無視できない複屈折を示す。
古典的インターフェロメトリでは、これらの回転は偏光誘起のフェロメトリ可視性の消失を引き起こす。
この実験室ノートでは、一般的な入力状態に対する繊維偏光回転を完全に補償する効率的な方法についてレビューする。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 19:00:09 GMT)
A Review of Validation and Verification of Neural Network-based Policies
for Sequential Decision Making [0.0] シーケンシャルな意思決定では、ニューラルネットワーク(NN)がエージェントのポリシーを表現し、学習するために一般的に使用される。
シーケンシャルな意思決定のために、これらの手法をNNベースのポリシーに適応する新たなアプローチが出現している。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 10:52:42 GMT)
A Review of Repository Level Prompting for LLMs [0.0] 大規模言語モデル(LLM)は、HumanEvalベンチマークで94.6%の解決率を達成するなど、顕著な成功を収めている。
GitHub CopilotやTab Nineといったリポジトリレベルのインラインコード補完ツールの商用化が進んでいる。
本稿では,個々のコーディング問題からリポジトリスケールソリューションへの移行について述べる。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 00:34:52 GMT)
A Quantum Algorithm for Solving the Advection Equation using Hamiltonian
Simulation [0.0] スパースハミルトニアンシミュレーションに基づく対流方程式を解く量子アルゴリズムを提案する。
有限差分離散化と明示的なオイラー時間積分から生じる行列は、時間内に解を進めるためにハミルトニアン内に埋め込まれる。
ユニタリ作用素はハミルトンの進化時間に関係なく行列を高い精度で埋め込むので、時間ステップは従来のオイラー法と同じ順序の確率と誤差で成功する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:39:27 GMT)
A Malware Classification Survey on Adversarial Attacks and Defences [0.0] ディープラーニングモデルはマルウェアの検出には有効だが、敵の攻撃に対して脆弱である。
このような攻撃は、検出に抵抗する悪意のあるファイルを生成し、重大なサイバーセキュリティリスクを生み出す。
近年の研究では、いくつかの敵対的攻撃と反応のアプローチが開発されている。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 09:25:48 GMT)
A Comparative Evaluation of Additive Separability Tests for
Physics-Informed Machine Learning [0.0] 加法分離性のために関数のサロゲートをテストするシナリオを考察する。
サロゲートが加法的に分離可能であるという検出は、さらなる学習を改善するために利用することができる。
本稿では,代用関数の混合部分微分を計算する8つの方法について,比較的かつ実験的に評価する。
論文参考訳(メタデータ) (Fri, 15 Dec 2023 13:28:42 GMT)