Fugu-MT: arxivの論文翻訳(概要)

Gemini: A Family of Highly Capable Multimodal Models [627.2]
マルチモーダルモデルの新たなファミリーであるGeminiは、画像、オーディオ、ビデオ、テキスト理解にまたがる優れた機能を示している。 GeminiファミリーはUltra、Pro、Nanoサイズで構成されており、複雑な推論タスクからオンデバイスメモリ制約のユースケースまで幅広い用途に適している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:35:21 GMT)
Infini-gram: Scaling Unbounded n-gram Language Models to a Trillion Tokens [138.4]
神経大言語モデル(LLM)の時代には,$n$-gramの言語モデルがいまだに関係していることを示す。これは、2つの側面で$n$-gramのLMを近代化することで実現された。まず、ニューラルネットワークLLMと同じデータスケールでトレーニングする -- 5兆トークン。次に、既存の$n$-gram LMは、そのパフォーマンスを妨げる小さな$n$を使用します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:14:53 GMT)
TIP-Editor: An Accurate 3D Editor Following Both Text-Prompts And Image-Prompts [119.8]
TIPEditorは、テキストと画像プロンプトの両方を受け入れる3Dシーン編集フレームワークであり、編集領域を指定するための3Dバウンディングボックスである。 TIP-Editorはテキストと画像のプロンプトに従って、指定されたバウンディングボックス領域で正確な編集を行うことを示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:55:59 GMT)
Advancing LLM Reasoning Generalists with Preference Trees [119.6]
推論に最適化された大規模言語モデル(LLM)のスイートであるEulusを紹介する。 Eurusモデルは、様々なベンチマークでオープンソースのモデルの間で最先端の結果を得る。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:25:30 GMT)
HyperCLOVA X Technical Report [119.1]
韓国語と文化に合わせた大型言語モデル(LLM)のファミリーであるHyperCLOVA Xを紹介する。 HyperCLOVA Xは韓国語、英語、コードデータのバランスの取れた混合でトレーニングされ、その後、高品質な人間アノテーション付きデータセットによる命令チューニングが行われた。このモデルは、韓国語と英語の両方で、包括的な推論、知識、常識、事実性、コーディング、数学、チャット、指示追従、無害など、様々なベンチマークで評価されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:48:49 GMT)
Direct Preference Optimization of Video Large Multimodal Models from Language Model Reward [118.7]
本稿では,映像コンテンツのプロキシとして詳細な動画キャプションを利用する新しいフレームワークを提案する。本稿では,DPOによる報酬の調整により,ビデオ質問応答(QA)タスクにおけるビデオLMMの性能が著しく向上することを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:47:49 GMT)
Multi-granular Adversarial Attacks against Black-box Neural Ranking Models [111.6]
脆弱性の発見の成功により、ランキング攻撃が注目を集めている。本稿では,多粒性摂動を取り入れた高品質な逆数例の生成に焦点をあてる。強化学習を用いて多粒体攻撃を行う。実験結果から,本手法は攻撃の有効性と非受容性の両方において,一般的なベースラインを超えていることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:08:29 GMT)
Real-time 3D-aware Portrait Editing from a Single Image [111.3]
3DPEは、参照画像やテキスト記述など、与えられたプロンプトに従って顔画像を編集することができる。軽量モジュールは、3Dポートレートジェネレータとテキスト・ツー・イメージ・モデルから蒸留される。コード、モデル、インターフェースは、将来の研究を促進するために公開されます。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:06:33 GMT)
MM-Interleaved: Interleaved Image-Text Generative Modeling via Multi-modal Feature Synchronizer [106.8]
本稿では,画像テキストデータのエンドツーエンド生成モデルであるMM-Interleavedを提案する。マルチスケールおよびマルチイメージ機能同期モジュールを導入し、以前のコンテキストできめ細かい画像機能に直接アクセスできるようにする。 MM-Interleavedはマルチモーダルな指示に従って視覚的詳細を認識し、テキストと視覚の両方の条件に従って一貫した画像を生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:20:50 GMT)
Don't throw away your value model! Generating more preferable text with Value-Guided Monte-Carlo Tree Search decoding [104.8]
PPO(Proximal Policy Optimization)に基づいて自然言語テキストを生成する場合、推論時探索アルゴリズムは不要に思えるかもしれない本稿では,モンテカルロ木探索 (MCTS) を統合することで,PPOから余分な距離を得ることが可能であることを実証する。提案するPPO-MCTSは,PPOから値ネットワークを統合することで,推論時生成時のポリシネットワークと密接に連携する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:51:49 GMT)
Dynamic Pre-training: Towards Efficient and Scalable All-in-One Image Restoration [100.5]
オールインワン画像復元は、各分解に対してタスク固有の非ジェネリックモデルを持たずに、統一されたモデルで異なるタイプの劣化に対処する。我々は、オールインワン画像復元タスクのためのエンコーダデコーダ方式で設計されたネットワークの動的ファミリであるDyNetを提案する。我々のDyNetは、よりバルク化と軽量化をシームレスに切り替えることができるので、効率的なモデルデプロイメントのための柔軟性を提供します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:58:49 GMT)
On the steerability of large language models toward data-driven personas [98.9]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:29:52 GMT)
Neuromorphic Split Computing with Wake-Up Radios: Architecture and Design via Digital Twinning [98.0]
本研究は,遠隔・無線接続型NPUからなる分割計算機システムに,覚醒無線機構を組み込んだ新しいアーキテクチャを提案する。覚醒無線に基づくニューロモルフィックスプリットコンピューティングシステムの設計における重要な課題は、検知、覚醒信号検出、意思決定のためのしきい値の選択である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:19:04 GMT)
Readout Guidance: Learning Control from Diffusion Features [96.2]
本稿では,学習信号を用いたテキスト・画像拡散モデル制御手法であるReadout Guidanceを提案する。 Readout Guidanceはリードアウトヘッドを使用し、トレーニング済みの凍結拡散モデルの特徴から信号を取り出すために訓練された軽量ネットワークである。これらの読み出しは、ポーズ、深さ、エッジなどのシングルイメージ特性や、対応性や外観類似性といった複数の画像に関連する高次特性を符号化することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:12:20 GMT)
Universal representations for financial transactional data: embracing local, global, and external contexts [95.8]
多様なビジネス課題に対処する表現学習フレームワークを提案する。また、データ固有性を考慮した新しい生成モデルを提案し、外部情報をクライアントの表現に統合する方法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:39:14 GMT)
ADDP: Learning General Representations for Image Recognition and Generation with Alternating Denoising Diffusion Process [94.4]
本稿では,2つの空間を1つの表現学習フレームワークに統合した交互デノナイジング拡散プロセス(ADDP)を提案する。復号化の各ステップでは、まず以前のVQトークンから画素をデコードし、次にデコードされたピクセルから新しいVQトークンを生成する。学習した表現は、多彩な高忠実度画像の生成や、認識タスクにおける優れた転送性能を示すために使用することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:12:29 GMT)
Deep Multi-Threshold Spiking-UNet for Image Processing [90.3]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:57:22 GMT)
GeneAvatar: Generic Expression-Aware Volumetric Head Avatar Editing from a Single Image [89.7]
本稿では,多種多様な3DMM駆動ヘッドアバターに適用可能な汎用的なアバター編集手法を提案する。この目的を達成するために、単一の画像から一貫した3D修正フィールドへのリフト2D編集を可能にする新しい表現対応修正生成モデルを設計する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:58:35 GMT)
PANDA: Prompt Transfer Meets Knowledge Distillation for Efficient Model Adaptation [89.0]
即時転送可能性(i)を正確に予測する新しい指標と,新しいPoTアプローチ(PANDA)を提案する。提案手法は,各タスクおよびモデルサイズの平均スコアの2.3%(最大24.1%)でバニラPoTアプローチを一貫して上回り,その3。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:00:39 GMT)
Flames: Benchmarking Value Alignment of LLMs in Chinese [86.7]
本稿では,Flamesという値アライメントベンチマークを提案する。一般的な無害の原則と、特定の中国の価値観を統合するユニークな道徳的側面の両方を包含している。以上の結果から, 評価されたLLMはフラムに対して比較的低い性能を示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:15:19 GMT)
CameraCtrl: Enabling Camera Control for Text-to-Video Generation [86.4]
ユーザーが希望するコンテンツを作成することができるため、ビデオ生成において制御性は重要な役割を担っている。既存のモデルは、撮影言語として機能するカメラポーズの正確な制御をほとんど見落としていた。我々は、テキスト・トゥ・ビデオ(T2V)モデルの正確なカメラポーズ制御を可能にするCameraCtrlを紹介する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:52:41 GMT)
Confidence-aware Reward Optimization for Fine-tuning Text-to-Image Models [86.0]
人間のフィードバックデータに基づいて訓練された報酬関数を持つ微調整テキスト・ツー・イメージモデルは、モデル行動と人間の意図との整合性を実証した。しかし、そのような報酬モデルによる過度な最適化は、単にプロキシの目的として機能し、微調整されたモデルの性能を損なう可能性がある。本研究では,テキストプロンプトの集合に対して推定された報酬モデル信頼度に基づいてアライメントを強化する手法であるTextNormを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:40:38 GMT)
Exploiting Diffusion Prior for Generalizable Dense Prediction [85.5]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:59:33 GMT)
Toward Efficient Visual Gyroscopes: Spherical Moments, Harmonics Filtering, and Masking Techniques for Spherical Camera Applications [83.9]
従来のRGBカメラに比べて視野が広い全方位カメラの統合は、より正確で堅牢な結果をもたらすことが証明されている。しかし、特徴が欠如し、大きなノイズが重大なエラーを引き起こし、画像の特定の特徴が十分な強度を欠いている状況において、課題が生じる。本稿では、分析手法とニューラルネットワークアプローチを組み合わせた新しい視覚ジャイロスコープを導入することにより、これらの課題に対処する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:19:06 GMT)
Improving Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts [83.6]
本稿では,オープンドメイン質問応答タスクにおいて,より長いコンテキストをカバーできる手法を提案する。コンテキストを効果的にエンコードする小さなエンコーダ言語モデルを利用し、エンコーダは元の入力とクロスアテンションを適用する。微調整後、2つのホールドインデータセット、4つのホールドアウトデータセット、および2つのIn Context Learning設定のパフォーマンスが改善された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:10:11 GMT)
Dichotomy of Early and Late Phase Implicit Biases Can Provably Induce Grokking [81.6]
Powerらによる最近の研究は、算術のタスクを学習する際の驚くべき"グロキング"現象を強調した。ニューラルネットワークはまずトレーニングセットを“記憶”し、完全なトレーニング精度を持つが、ほぼランダムなテスト精度を実現する。本論文は, 理論設定におけるグルーキング現象を考察し, 初期および後期の暗黙バイアスの2分法により誘導可能であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:43:18 GMT)
Distilling Semantic Priors from SAM to Efficient Image Restoration Models [80.8]
画像復元(IR)では、セグメンテーションモデルからセグメンテーションの事前情報を活用することが、性能向上のための一般的なアプローチである。近年のセグメンテーション・アズ・モデル (SAM) は、IRタスクを強化するために先進的なセグメンテーション先行を抽出する強力なツールとして登場した。本稿では,SAMのセマンティック知識を抽出し,推論プロセスに干渉することなく,IRモデルからの撤退を促進するための一般的な枠組みを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:25:07 GMT)
Exploring Latent Pathways: Enhancing the Interpretability of Autonomous Driving with a Variational Autoencoder [79.7]
バイオインスパイアされたニューラルサーキットポリシーモデルが革新的な制御モジュールとして登場した。我々は、変分オートエンコーダとニューラルネットワークポリシーコントローラを統合することで、飛躍的に前進する。本研究は,変分オートエンコーダへのアーキテクチャシフトに加えて,自動潜時摂動ツールを導入する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:05:47 GMT)
CASA: Causality-driven Argument Sufficiency Assessment [79.1]
ゼロショット因果関係に基づく議論十分性評価フレームワークであるCASAを提案する。 PSは前提イベントの導入が前提イベントと結論イベントの両方が欠落した場合の結論につながる可能性を測っている。 2つの論理的誤り検出データセットの実験により、CASAは不十分な議論を正確に識別することを示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:42:52 GMT)
Event Detection from Social Media for Epidemic Prediction [76.9]
ソーシャルメディア投稿から疫病関連事象を抽出・分析する枠組みを構築した。実験では、新型コロナウイルスベースのSPEEDで訓練されたEDモデルが、3つの目に見えない流行の流行を効果的に検出する方法が明らかにされている。モンキーポックスのWHO流行宣言より4～9週間早く,抽出した事象の報告が急激な増加を示すことを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:31:17 GMT)
Omni-SMoLA: Boosting Generalist Multimodal Models with Soft Mixture of Low-rank Experts [74.4]
大規模マルチモーダルモデル (LMM) は多くのタスクにまたがって優れた性能を示す。ジェネラリストのLMMは、タスクの集合をチューニングする際に、しばしばパフォーマンスの劣化に悩まされる。我々は,Omni-SMoLAを提案する。Omni-SMoLAはSoft MoEアプローチを用いて,多くのマルチモーダルな低ランクの専門家を混在させるアーキテクチャである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:57:32 GMT)
AceGPT, Localizing Large Language Models in Arabic [73.4]
本稿では,アラビア語のテキストによる事前学習,ネイティブなアラビア語命令を利用したSFT(Supervised Fine-Tuning),アラビア語のGPT-4応答を含む総合的なソリューションを提案する。目標は、文化的に認知され、価値に整合したアラビア語のLLMを、多様で応用特有のアラビア語コミュニティのニーズに適応させることである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:04:16 GMT)
Federated Distillation: A Survey [73.1]
Federated Learning (FL)は、個々のクライアントからプライベートトレーニングデータを共有せずに、モデルを協調的にトレーニングすることを目指している。 FLへの知識蒸留の統合が提案され、Federated Distillation(FD)と呼ばれるものを形成する。 FDはクライアントとサーバ間のより柔軟な知識伝達を可能にし、単なるモデルパラメータの共有を超越します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:42:18 GMT)
BRAVEn: Improving Self-Supervised Pre-training for Visual and Auditory Speech Recognition [72.5]
本稿では,RAVEn法の拡張であるBRAVEnを提案する。 RAVEnの修正により、BRAVEnは自己教師付き手法で最先端の結果を得ることができる。以上の結果から,手軽に手軽に利用できる音声視覚データが,コストのかかる書き起こしデータに置き換わる可能性が示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:48:20 GMT)
Measuring and Controlling Instruction (In)Stability in Language Model Dialogs [72.4]
System-promptingは、言語モデルチャットボットをカスタマイズするツールで、特定の命令に従うことができる。本稿では,仮説を検証し,セルフチャットによる命令安定性の評価を行うベンチマークを提案する。我々は8ラウンドの会話で重要な指示ドリフトを明らかにした。そこで本研究では,2つの強力なベースラインに対して良好に比較可能なsplit-softmaxという軽量な手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:13:24 GMT)
MultiParaDetox: Extending Text Detoxification with Parallel Data to New Languages [71.5]
テキスト・デトックス化(英: text detoxification)とは、テキストが有害な表面形態(例えば無作為な単語を特徴付けるような)から中性レジスタへパラフレーズ化されるタスクである。並列テキストデトキシフィケーションコーパスコレクション(ParaDetoxとAPPADIA)の最近のアプローチはモノリンガル設定でのみ検討されている。本研究では,ParaDetoxパイプラインをMultiParaDetoxを示す複数の言語に拡張し,任意の言語に対して並列デトキシフィケーションコーパスコレクションを自動化することを目的とする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:32:32 GMT)
Few-shot Link Prediction on N-ary Facts [70.8]
ハイパーリレーショナル・ファクト(LPHFs)のリンク予測は、ハイパーリレーショナル・事実の欠落要素を予測することである。 Few-Shot Link Prediction on Hyper-Relational Facts (PHFs) は、サポートインスタンスが限定されたハイパーリレーショナルな事実において、欠落したエンティティを予測することを目的としている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:11:01 GMT)
An Empirical Study of Catastrophic Forgetting in Large Language Models During Continual Fine-tuning [70.5]
カタストロフィック・ナッシング(英: Catastrophic forgetting、CF)は、機械学習において、モデルが新しい知識を取得しながら学習した情報を忘れたときに発生する現象である。本研究では,大規模言語モデル(LLM)における連続的指導調律時の忘れ現象を実験的に評価する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:05:51 GMT)
Foundation Models for Time Series Analysis: A Tutorial and Survey [70.4]
ファンデーションモデル(FM)は、時系列分析のためのモデル設計のパラダイムを根本的に変えてきた。本調査は,時系列解析のためのFMの概要を包括的かつ最新のものにすることを目的としている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:38:02 GMT)
Selective Temporal Knowledge Graph Reasoning [70.1]
時間的知識グラフ(TKG)は、与えられた歴史的事実に基づいて将来の事実を予測することを目的としている。既存のTKG推論モデルは、不確実な予測を控えることができない。本稿では,既存のモデルが無差別な予測ではなく選択的に行うのに役立つ,TKG推論の棄却機構を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:56:21 GMT)
Knowledge Boundary and Persona Dynamic Shape A Better Social Media Agent [69.1]
パーソナライズされた知識と動的ペルソナ情報に基づくソーシャルメディアエージェントを構築する。パーソナライズされた知識に対して、外部知識ソースを追加し、エージェントのペルソナ情報とマッチングすることにより、エージェントにパーソナライズされた世界知識を与える。動的ペルソナ情報については、現在の行動情報を用いてエージェントのペルソナ情報を内部的に検索し、現在の行動に対する多様なペルソナ情報の干渉を低減する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:59:23 GMT)
Entity Disambiguation via Fusion Entity Decoding [69.0]
より詳細なエンティティ記述を持つエンティティを曖昧にするためのエンコーダ・デコーダモデルを提案する。 GERBILベンチマークでは、EntQAと比較して、エンド・ツー・エンドのエンティティリンクが+1.5%改善されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:27:54 GMT)
Spin-UP: Spin Light for Natural Light Uncalibrated Photometric Stereo [68.9]
Natural Light Uncalibrated Photometric Stereo (NaUPS) は、古典的uncalibrated Photometric Stereo (UPS) 法における厳密な環境と光仮定を緩和する。既存の作業は環境光やオブジェクトの材料に強い仮定を課し、より一般的なシナリオにおける有効性を制限する。我々は,様々な環境光や物体のNaUPSに対処するための教師なし手法であるSpin-UP(Spin Light Uncalibrated Photometric Stereo)を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:29:23 GMT)
Value Kaleidoscope: Engaging AI with Pluralistic Human Values, Rights, and Duties [68.7]
価値多元性とは、複数の正しい値が互いに緊張して保持されるという考え方である。統計的学習者として、AIシステムはデフォルトで平均に適合する。 ValuePrismは、218kの値、権利、義務の大規模なデータセットで、31kの人間が記述した状況に関連付けられています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:52:03 GMT)
Class-Incremental Few-Shot Event Detection [68.7]
本稿では,クラスインクリメンタルなイベント検出と呼ばれる新しいタスクを提案する。このタスクは、古い知識の忘れと新しいクラスオーバーフィットという2つの問題に直面している。そこで本研究では,Prompt-KDと呼ばれる新しい知識蒸留法と迅速な学習手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:31:14 GMT)
RAT: Retrieval-Augmented Transformer for Click-Through Rate Prediction [68.3]
本稿では, 試料内および試料間における微細な特徴相互作用の獲得を目的とした検索-拡張変換器(RAT)を開発した。次に、トランスフォーマー層をカスケードされた注意で構築し、イントラサンプルとクロスサンプルの両方の機能インタラクションをキャプチャします。実世界のデータセットの実験は、RATの有効性を裏付け、ロングテールシナリオにおいてその利点を示唆している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:14:23 GMT)
Test-Time Model Adaptation with Only Forward Passes [68.1]
テストタイム適応は、トレーニング済みのモデルを、潜在的に分布シフトのある未確認テストサンプルに適応させるのに有効であることが証明されている。テスト時間フォワードオンリー適応法(FOA)を提案する。 FOAは量子化された8ビットのViTで動作し、32ビットのViTで勾配ベースのTENTより優れ、ImageNet-Cで最大24倍のメモリ削減を実現する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:34:33 GMT)
Towards Better Generalization in Open-Domain Question Answering by Mitigating Context Memorization [67.9]
Open-Domain Question Answering (OpenQA)は、外部の大規模知識コーパスで事実質問に答えることを目的としている。 OpenQAモデルが完全に新しい知識ドメインにどの程度うまく移行できるかは、まだ不明である。コーパス不変チューニング(CIT: Corpus-Invariant Tuning)は,記憶過剰な知識の軽減を目的とした,シンプルで効果的なトレーニング戦略である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:44:50 GMT)
Grounding Gaps in Language Model Generations [67.8]
大規模言語モデルが人間の接地を反映したテキストを生成するかどうかを考察する。人間に比べ、LLMは会話の基盤を減らした言語を生成する。同定された接地ギャップの根源を理解するために,命令チューニングと選好最適化の役割について検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:34:15 GMT)
LLMRefine: Pinpointing and Refining Large Language Models via Fine-Grained Actionable Feedback [65.8]
最近の大規模言語モデル(LLM)は、世代品質を改善するために人間のフィードバックを活用している。 LLMの出力を最適化する推論時間最適化手法であるLLMRefineを提案する。機械翻訳、長文質問応答(QA)、話題要約を含む3つのテキスト生成タスクについて実験を行った。 LLMRefineは、すべてのベースラインアプローチを一貫して上回り、翻訳タスクの1.7 MetricXポイント、ASQAの8.1 ROUGE-L、トピックの要約の2.2 ROUGE-Lの改善を実現している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:39:13 GMT)
SDGE: Stereo Guided Depth Estimation for 360$^\circ$ Camera Sets [65.6]
マルチカメラシステムは、360ドル周の知覚を達成するために、しばしば自律走行に使用される。 360ドル(約3万3000円)のカメラセットは、しばしば制限または低品質のオーバーラップ領域を持ち、画像全体に対してマルチビューステレオメソッドを実現する。重なりの重なりに多視点ステレオ結果を明示的に利用することにより、全画像の深さ推定を強化するステレオガイド深度推定法(SGDE)を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:02:04 GMT)
Instruction-following Evaluation through Verbalizer Manipulation [64.7]
本稿では,動詞操作と呼ばれる新しい指示追従評価プロトコルを提案する。モデルにタスクラベルを、異なる範囲のモデル先行と整合した単語で言語化するように指示する。異なる家族や規模にわたるモデルの指示追従能力は、より自然な話し手の性能によって著しく異なることが観察された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:38:21 GMT)
Heat Death of Generative Models in Closed-Loop Learning [63.8]
本研究では、独自の学習データセットに加えて、生成したコンテンツをフィードバックする生成モデルの学習ダイナミクスについて検討する。各イテレーションで十分な量の外部データが導入されない限り、非自明な温度がモデルを退化させることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:51:39 GMT)
On-Demand Sampling: Learning Optimally from Multiple Distributions [63.2]
社会と現実世界の考察は、マルチディストリビューション学習パラダイムの台頭につながっている。これらの学習パラダイムの最適なサンプル複雑性を確立し、このサンプル複雑性を満たすアルゴリズムを提供する。アルゴリズムの設計と解析は,ゼロサムゲーム解決のためのオンライン学習手法の拡張によって実現されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:48:13 GMT)
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.2]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:37:25 GMT)
LLM-Rec: Personalized Recommendation via Prompting Large Language Models [62.5]
大きな言語モデル(LLM)は、常識的な知識と推論を活用する能力を示した。大規模言語モデル(LLM)の最近の進歩は、コモンセンスの知識と推論を活用できることを顕著に示している。本研究では,パーソナライズされたテキストベースのレコメンデーションを改善するために,テキストエンリッチメントの4つの異なる促進戦略を取り入れた新しいアプローチ LLM-Rec を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:59:51 GMT)
Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.2]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:41:53 GMT)
GenHowTo: Learning to Generate Actions and State Transformations from Instructional Videos [60.7]
動作とオブジェクト状態変換の時間的一貫性と物理的に妥当な画像を生成するタスクに対処する。対象の変換を記述した入力画像とテキストプロンプトが与えられた場合、生成した画像は環境を保存し、初期画像内のオブジェクトを変換する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:35:32 GMT)
EpiDiff: Enhancing Multi-View Synthesis via Localized Epipolar-Constrained Diffusion [60.3]
EpiDiffは、局所的なインタラクティブなマルチビュー拡散モデルである。 16枚のマルチビュー画像をわずか12秒で生成する。品質評価の指標では、以前の手法を上回ります。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:18:36 GMT)
MetaCloak: Preventing Unauthorized Subject-driven Text-to-image Diffusion-based Synthesis via Meta-learning [60.0]
テキストから画像への拡散モデルにより、スキャンされた参照写真からパーソナライズされた画像をシームレスに生成できる。既存のアプローチは、悪意のある使用から"学習不能"なイメージをレンダリングするために、知覚不可能な方法でユーザーイメージを摂動させる。メタ学習フレームワークを用いて,バイレベル中毒の問題を解決するメタクラックを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:42:51 GMT)
PointMamba: A Simple State Space Model for Point Cloud Analysis [59.4]
本稿では,大域的モデリングと線形複雑度を考慮したフレームワークであるPointMambaを提案する。組込み点パッチを入力として,SSMのグローバルモデリング能力を高めるための並べ替え戦略を提案する。実験の結果,提案したPointMambaは,異なるポイントクラウド分析データセット上で,トランスフォーマーをベースとした性能よりも優れていた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:26:43 GMT)
Anti-LM Decoding for Zero-shot In-context Machine Translation [59.3]
本研究は, 文脈内機械翻訳の弱点に対処するために, 減衰係数を付加したアンチランゲージモデルを提案する。 3つのモデルタイプとサイズ,3つの言語方向,およびグリージーデコーディングとビームサーチの両方に対して実験を行う。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:03:15 GMT)
Rephrase, Augment, Reason: Visual Grounding of Questions for Vision-Language Models [59.1]
Rephrase, Augment and Reason (RepARe) は勾配のないフレームワークで、基礎となる視覚言語モデルを用いて画像に関する詳細な情報を抽出する。その結果、VQAv2では3.85%(絶対)、A-OKVQAでは6.41%、VizWizでは7.94%の増加が見られた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:37:42 GMT)
Segment Any 3D Object with Language [58.5]
本稿では,Segment any 3D Object with LanguagE (SOLE)を紹介した。具体的には、バックボーンとデコーダの両方にマルチモーダル意味を組み込むマルチモーダル融合ネットワークを提案する。我々のSOLEは、ScanNetv2、ScanNet200、Replicaベンチマークにおいて、従来の方法よりも大きなマージンで優れている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:59:10 GMT)
Rethinking Saliency-Guided Weakly-Supervised Semantic Segmentation [58.0]
本稿では,弱教師付きセマンティックセグメンテーション(WSSS)におけるサリエンシマップの役割について,新たな視点を提示する。我々は、サリエンシマップの品質が、サリエンシ誘導型WSSSアプローチにおいて重要な要素であることを観察した。統一された条件下で研究を行うための標準化されたフレームワークである textttWSSS-BED を紹介する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:20:28 GMT)
AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:46:37 GMT)
Will My Robot Achieve My Goals? Predicting the Probability that an MDP Policy Reaches a User-Specified Behavior Target [57.0]
自律的なシステムがタスクを実行する場合、ユーザの目標を達成する確率のキャリブレーションされた見積もりを維持する必要がある。本稿では,ユーザの目標が目標間隔として指定される設定について検討する。我々は、共形予測を反転させて確率推定を計算する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:15:23 GMT)
Incentives in Private Collaborative Machine Learning [56.8]
コラボレーション型機械学習は、複数のパーティのデータに基づいてモデルをトレーニングする。インセンティブとして差分プライバシー(DP)を導入する。合成および実世界のデータセットに対するアプローチの有効性と実用性を実証的に実証した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:28:22 GMT)
On the Stability of Iterative Retraining of Generative Models on their own Data [56.2]
混合データセットに対する生成モデルの訓練が与える影響について検討する。まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。我々は、正規化フローと最先端拡散モデルを繰り返し訓練することにより、合成画像と自然画像の両方に関する我々の理論を実証的に検証する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:09:40 GMT)
Quantifying Self-diagnostic Atomic Knowledge in Chinese Medical Foundation Model: A Computational Analysis [55.7]
ファンデーションモデル(FM)は、直接的で効率的な提案を提供することで、ユーザーが検索エンジンを通して自己診断する方法に革命をもたらす可能性がある。近年の研究では、GPT-4で評価されたFMの品質や、医学試験に合格する能力に焦点が当てられている。 FMの記憶に蓄えられた自己診断的原子知識の程度を定量化する研究はない。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:48:22 GMT)
Sketch3D: Style-Consistent Guidance for Sketch-to-3D Generation [55.7]
本稿では,テキスト記述と一致する色と入力スケッチに整合した形状のリアルな3Dアセットを生成するための,新しい生成パラダイムSketch3Dを提案する。 3つの戦略は、3次元ガウスの最適化、すなわち分布伝達機構による構造最適化、直感的なMSE損失による色最適化、CLIPに基づく幾何学的類似性損失によるスケッチ類似性最適化である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:03:24 GMT)
A Paradigm Shift: The Future of Machine Translation Lies with Large Language Models [55.4]
深層ニューラルネットワークの発展により、機械翻訳は長年にわたって大きく進歩してきた。 GPT-4やChatGPTのような大規模言語モデル(LLM)の出現は、MTドメインに新しいフェーズを導入している。我々は、Long-Document Translation、Stylized Translation、Interactive TranslationなどのシナリオにおけるLLMの利点を強調し、新しいMT方向を強調した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:56:56 GMT)
Quantum charges of harmonic oscillators [55.2]
エネルギー固有関数 $psi_n$ と $nge 1$ はオービフォールド $mathbbR2/mathbbZ_n$ 上の複素座標であることを示す。また、反対の量子電荷と同じ正のエネルギーを持つ「アンチオシレータ」についても論じる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:16:18 GMT)
Adversarial Combinatorial Bandits with Switching Costs [55.2]
本稿では,各ラウンドで選択したアームのスイッチに対して,切替コストが$lambda$の逆帯域問題について検討する。ミニマックスの後悔とそれにアプローチするための設計アルゴリズムの限界を低くする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:15:37 GMT)
Learning to Compress Prompt in Natural Language Formats [54.1]
大規模言語モデル(LLM)は、複数の自然言語処理タスクを処理するのに優れている。 LLMは、長いコンテキスト、遅い推論速度、高い計算コストによる性能の低下によって制約される。本研究の目的は、LLM転送性を備えた自然言語形式で長いプロンプトを圧縮することである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:38:31 GMT)
What if you said that differently?: How Explanation Formats Affect Human Feedback Efficacy and User Perception [53.5]
我々は,QAモデルが生成した有理性の効果を分析し,その答えを支持する。ユーザに対して,様々な形式で誤った回答とそれに対応する有理性を提示する。このフィードバックの有効性を,文脈内学習を通じて評価する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:59:36 GMT)
Already Moderate Population Sizes Provably Yield Strong Robustness to Noise [53.3]
2つの進化的アルゴリズムは、OneMaxベンチマークのランタイムを増大させることなく、一定のノイズ確率を許容できることを示す。この結果は、ノイズのない子孫は親と騒々しい子孫の間に偏りのある均一な交叉と見なすことができるという、新しい証明の議論に基づいている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:35:52 GMT)
Large Language Models for Mathematicians [53.3]
大規模言語モデル(LLM)は、汎用言語理解、特に高品質なテキストやコンピュータコードを生成する能力に多大な関心を集めている。本稿では,プロの数学者をどの程度支援できるかについて論じる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:35:40 GMT)
Decoupled Diffusion Models: Simultaneous Image to Zero and Zero to Noise [53.0]
10機能未満の高画質(未条件)の画像生成のためのデカップリング拡散モデル(DDM)を提案する。我々は,1) 画像から0遷移までをモデル化した解析的遷移確率に基づいて, 学習目標と(2) サンプリング式を逆時間に導出する。 1)無条件画像生成, CIFAR-10, CelebA-HQ-256, 2)超解像, 塩分検出, エッジ検出, 画像入力などの下流処理, テキスト処理, テキスト処理, テキスト処理, テキスト処理, 画像処理, 画像処理などと比較して, 非常に競争力のある性能が得られる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:57:06 GMT)
OSCaR: Object State Captioning and State Change Representation [52.1]
本稿では,OSCaR(Object State Captioning and State Change Representation)データセットとベンチマークを紹介する。 OSCaRは14,084の注釈付きビデオセグメントで構成され、様々なエゴセントリックなビデオコレクションから1,000近いユニークなオブジェクトが集められている。マルチモーダル大言語モデル(MLLM)を評価するための新しいテストベッドを設定する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:14:42 GMT)
How to Train Your YouTube Recommender to Avoid Unwanted Videos [51.7]
興味がない」ボタンと「推奨しないチャンネル」ボタンは、ユーザーが望ましくないリコメンデーションを提示すると、不関心を示すことができる。われわれはYouTubeユーザーをソックパペットエージェントでシミュレートした。ボタンが一番うまく機能し、テスト対象のトピックすべてにおいて、このような推奨が大幅に減りました。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:18:23 GMT)
ExpertQA: Expert-Curated Questions and Attributed Answers [51.7]
我々は,様々な属性と事実の軸に沿って,いくつかの代表システムからの応答を人為的に評価する。我々は32分野にわたる484人の被験者から専門家による質問を収集し、同じ専門家に自身の質問に対する反応を評価する。分析の結果は,32分野にまたがる2177の質問と,回答の検証とクレームの属性を備えた高品質な長文QAデータセットであるExpertQAである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:07:05 GMT)
Predicting the Intention to Interact with a Service Robot:the Role of Gaze Cues [51.6]
サービスロボットは、接近する人が対話する意図をできるだけ早く知覚する必要がある。我々は,この認識課題を,対話を意図した潜在的なユーザ意図のシーケンス・ツー・シーケンス分類器を用いて解決する。我々の主な貢献は、この文脈における人の視線を表す特徴の利点の研究である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:22:54 GMT)
From Shortcuts to Triggers: Backdoor Defense with Denoised PoE [51.3]
言語モデルは、しばしば多様なバックドア攻撃、特にデータ中毒の危険にさらされる。既存のバックドア防御手法は主に明示的なトリガーによるバックドア攻撃に焦点を当てている。我々は,様々なバックドア攻撃を防御するために,エンド・ツー・エンドアンサンブルに基づくバックドア防御フレームワークDPoEを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:01:17 GMT)
High-throughput Visual Nano-drone to Nano-drone Relative Localization using Onboard Fully Convolutional Networks [51.2]
相対的なドローンとドローンのローカライゼーションは、どんなSwarm操作でも基本的なビルディングブロックである。我々は、新しいビジョンベース完全畳み込みニューラルネットワーク(FCNN)に基づく垂直統合システムを提案する。その結果,水平画像座標で32～47%,垂直画像座標で18～55%,実世界の30k画像のデータセットでR2乗改善が得られた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:01:44 GMT)
Can LLMs Generate Human-Like Wayfinding Instructions? Towards Platform-Agnostic Embodied Instruction Synthesis [51.0]
本稿では,ロボットエージェントの「ウェイフィンディング指示」を自動的に合成する手法を提案する。提案アルゴリズムは,LLMの条件付けにコンテキスト内学習を用い,わずかな参照を用いて命令を生成する。我々は,Matterport3D,AI Habitat,ThreeDWorldなど,複数のシミュレーションプラットフォームにアプローチを実装した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:27:55 GMT)
Benchmarking Private Population Data Release Mechanisms: Synthetic Data vs. TopDown [50.4]
本研究では、TopDownアルゴリズムとプライベート合成データ生成を比較し、クエリの複雑さによる精度への影響を判定する。この結果から,TopDownアルゴリズムは,分散クエリに対して,評価したどの合成データ手法よりもはるかに優れたプライバシー-忠実トレードオフを実現することがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:54:24 GMT)
Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.4]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:54:46 GMT)
Leveraging Prototypical Representations for Mitigating Social Bias without Demographic Information [50.3]
DAFairは、言語モデルにおける社会的バイアスに対処する新しいアプローチである。偏見を緩和するために、原型的人口統計テキストを活用し、微調整プロセス中に正規化用語を取り入れる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:14:24 GMT)
A noisy elephant in the room: Is your out-of-distribution detector robust to label noise? [49.9]
我々は、最先端のOOD検出方法20について詳しく検討する。不正に分類されたIDサンプルとOODサンプルの分離が不十分であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:40:22 GMT)
OOSTraj: Out-of-Sight Trajectory Prediction With Vision-Positioning Denoising [49.9]
軌道予測はコンピュータビジョンと自律運転の基本である。この分野における既存のアプローチは、しばしば正確で完全な観測データを仮定する。本稿では,視覚的位置決め技術を利用した視線外軌道予測手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:30:29 GMT)
Neural Implicit Representations for Physical Parameter Inference from a Single Video [49.8]
本稿では,外見モデルのためのニューラル暗黙表現と,物理現象をモデル化するためのニューラル常微分方程式(ODE)を組み合わせることを提案する。提案モデルでは,大規模なトレーニングデータセットを必要とする既存のアプローチとは対照的に,単一のビデオから物理的パラメータを識別することが可能になる。ニューラル暗示表現を使用することで、高解像度ビデオの処理とフォトリアリスティック画像の合成が可能になる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:24:37 GMT)
Joint Multimodal Transformer for Emotion Recognition in the Wild [49.7]
マルチモーダルな感情認識は典型的には単調なシステムより優れていますキーベースクロスアテンションと融合するジョイントマルチモーダルトランスを利用するMMER法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:34:04 GMT)
PREGO: online mistake detection in PRocedural EGOcentric videos [49.7]
自己中心型ビデオにおける誤り検出のための,最初のオンライン一級分類モデルであるPregoを提案する。 PreGOは、現在のアクションをモデル化するオンラインアクション認識コンポーネントと、次のアクションを予測するシンボリック推論モジュールに基づいている。手続き的誤り検出のオンラインベンチマークに適応する2つの手続き的自己中心型ビデオデータセットであるAmbly101とEpic-tentについてPreGOを評価した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:27:28 GMT)
Quantifying Noise of Dynamic Vision Sensor [49.7]
動的視覚センサ(DVS)は、大量のバックグラウンドアクティビティ(BA)ノイズによって特徴付けられる。標準的な画像処理技術を用いて,ノイズとクリーン化センサ信号とを区別することは困難である。 Detrended Fluctuation Analysis (DFA) から得られたBAノイズを特徴付ける新しい手法が提案されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:43:08 GMT)
Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.2]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。従来は検索キーやクエリとして生の対話コンテキストを使用していた。会話のテキスト要約に基づいて会話検索を行う。 LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:06:52 GMT)
Effective Large Language Model Adaptation for Improved Grounding and Citation Generation [48.1]
本稿では,検索した文の応答を基底にして,引用を提供することにより,大規模言語モデル(LLM)の改善に焦点を当てる。我々は、全体論的観点から基盤を改善する新しいフレームワーク AGREE を提案する。我々のフレームワークは, LLMを調整し, その要求を自己評価し, 検索した文書に正確な引用を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:04:01 GMT)
Survey of Bias In Text-to-Image Generation: Definition, Evaluation, and Mitigation [47.8]
単純なプロンプトであっても、T2Iモデルは生成された画像に顕著な社会的偏見を示す可能性がある。本研究は,T2I生成モデルにおけるバイアスに関する最初の広範な調査である。これらの作業がどのようにしてバイアスの異なる側面を定義し、評価し、緩和するかについて議論する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:36:28 GMT)
Beyond Image Super-Resolution for Image Recognition with Task-Driven Perceptual Loss [47.4]
画像認識のための超解法(SR4IR)は、画像認識性能に有用なSR画像の生成をガイドする。本稿では,SR4IRが,特定の画像認識タスクに有用なSR画像を生成することで,優れたタスク性能を実現することを実証する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:52:31 GMT)
Event-assisted Low-Light Video Object Segmentation [47.3]
イベントカメラは、このような低照度条件下でオブジェクトの可視性を高め、VOSメソッドを支援することを約束する。本稿では、イベントカメラデータを利用してセグメンテーション精度を向上させる、低照度VOSに適した先駆的なフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:41:22 GMT)
Bidirectional Multi-Scale Implicit Neural Representations for Image Deraining [47.2]
高品質な画像再構成を実現するために,エンド・ツー・エンドのマルチスケールトランスを開発した。クローズドループ設計において、劣化した入力を持つ画素座標に基づいて、スケール内の暗黙的ニューラル表現を組み込む。我々のアプローチはNeRD-Rainと呼ばれ、合成および実世界のベンチマークデータセットにおいて最先端のアプローチに対して好意的に実行されます。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:18:16 GMT)
Satellite Federated Edge Learning: Architecture Design and Convergence Analysis [47.1]
本稿では,FEDMEGAという新しいFEELアルゴリズムを提案する。軌道内モデルアグリゲーションのための衛星間リンク(ISL)を統合することにより、提案アルゴリズムは低データレートと断続的なGSLの使用を著しく削減する。提案手法は,環全リデューサに基づく軌道内アグリゲーション機構と,グローバルモデルアグリゲーションのためのネットワークフローベースのトランスミッションスキームを組み合わせたものである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:59:58 GMT)
FLawN-T5: An Empirical Examination of Effective Instruction-Tuning Data Mixtures for Legal Reasoning [47.0]
LawInstructは17の管轄区域、24の言語、合計12万のサンプルをカバーする大規模な法的命令データセットである。ドメイン固有の事前学習と指導訓練がLegalBenchの性能を向上させることを示す。 LawInstructは、より強力な情報処理と法的領域における意思決定能力を備えたモデルの開発を促進するためのリソースである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:33:34 GMT)
Polarity Calibration for Opinion Summarization [46.8]
極性校正は、出力要約の極性と入力テキストの極性を調整することを目的としている。本稿では,製品レビューの要約と政治意見記事の要約という,2種類の意見要約タスクをモデルとして評価する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:43:12 GMT)
Topic-based Watermarks for LLM-Generated Text [46.7]
大規模言語モデル(LLM)のための「トピックベース透かしアルゴリズム」を提案する。提案アルゴリズムは,入力プロンプトの抽出されたトピックや非透かしLLMの出力に基づいて,透かしLLM出力のトークンを生成する方法を決定する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:49:40 GMT)
PatchCURE: Improving Certifiable Robustness, Model Utility, and Computation Efficiency of Adversarial Patch Defenses [46.1]
敵パッチ攻撃に対する最先端の防御は、モデルユーティリティの限界低下によって、強力な証明可能な堅牢性を達成することができる。この印象的なパフォーマンスは、通常、未定義のモデルに比べて10～100倍の推論時間計算コストがかかる。本稿では,このトレードオフ問題に対処するためのPatchCUREという防衛フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:14:16 GMT)
Hallucination Diversity-Aware Active Learning for Text Summarization [46.0]
LLM(Large Language Models)は、幻覚出力を生成するための妥当性を示す。幻覚を緩和するための既存の方法は、通常、LLM出力の幻覚を識別し修正するために、人為的なアノテーションを必要とする。 LLM幻覚を緩和する最初のアクティブラーニングフレームワークを提案し,必要な幻覚アノテーションのコストを削減した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:30:27 GMT)
IISAN: Efficiently Adapting Multimodal Representation for Sequential Recommendation with Decoupled PEFT [46.0]
IISAN(Intra- and Inter-modal Side Adapted Network for Multimodal Representation)は、シーケンシャルなレコメンデーションシステムのためのプラグイン・アンド・プレイアーキテクチャである。 IISANはフルファインチューニング(FFT)と最先端PEFTのパフォーマンスにマッチする。マルチモーダルシーケンシャルレコメンデーションタスクでは、47GBからわずか3GBへと大幅に削減される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:58:36 GMT)
A Simple Recipe for Language-guided Domain Generalized Segmentation [45.9]
トレーニング中に見えない新しいドメインへの一般化は、ニューラルネットワークを現実世界のアプリケーションにデプロイする上での長年の課題のひとつだ。本稿では,言語をランダム化の源とすることで意味分節ネットワークを一般化するシンプルなフレームワークを提案する。筆者らのレシピは, (i) 極小調整による内在的CLIPロバスト性の保存, (ii) 言語駆動型ローカルスタイル拡張, (iii) 訓練中のソースと拡張スタイルを局所的に混合したランダム化という3つの重要な要素から構成される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:20:58 GMT)
IsoBench: Benchmarking Multimodal Foundation Models on Isomorphic Representations [45.7]
本稿では,数学,科学,アルゴリズム,ゲームという4つの主要分野の問題を含むベンチマークデータセットを提案する。 IsoBenchは、表現形式に起因するパフォーマンスギャップを診断するために、きめ細かいフィードバックを提供する。本稿では,2つのプロンプト技術, $textitIsoCombination$ と $textitIsoScratchPad$ を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:46:13 GMT)
VLRM: Vision-Language Models act as Reward Models for Image Captioning [45.6]
本稿では,CLIP や BLIP2-ITM などの視覚言語モデルを用いた画像キャプションモデルの拡張手法を提案する。われわれのモデルはMS-COCO Carpathy Test Splitで0.90 R@1 CLIP Recallスコアに達した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:57:22 GMT)
ASTRA: An Action Spotting TRAnsformer for Soccer Videos [45.6]
ASTRAは、サッカーの試合におけるアクションスポッティングのタスク用に設計されたトランスフォーマーベースのモデルである。 ASTRAはタスクとデータセットに固有のいくつかの課題に対処する。その結果、ASTRAの有効性が示され、テストセット上で平均平均mAP66.82が達成された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:29:04 GMT)
SurMo: Surface-based 4D Motion Modeling for Dynamic Human Rendering [45.5]
統合されたフレームワークにおける時間的ダイナミクスと人間の外見をモデル化する新しい4DモーションパラダイムであるSurMoを提案する。効率的なコンパクトな表面ベース三面体で4次元の人間の動きをモデル化する表面ベースの動き符号化。身体運動学習を促進するために設計された身体運動復号法。表面条件の効率的なデコードにより、モーショントリプレーンを画像にレンダリングする4次元の外観モデリング。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:59:48 GMT)
StructLDM: Structured Latent Diffusion for 3D Human Generation [45.5]
StructLDMは2次元画像から学習した拡散に基づく非条件の人間の生成モデルである。ポーズ/ビュー/シェイプコントロールや、合成世代、部品認識の衣服編集、3Dバーチャルトライオンなどのハイレベルなタスクなど、さまざまなレベルのコントロール可能な3Dヒューマン生成と編集を可能にする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:56:45 GMT)
Iterated Learning Improves Compositionality in Large Vision-Language Models [45.1]
本稿では,構成性にインセンティブを与える新しい反復学習アルゴリズムを提案する。我々は、視覚エージェントと言語エージェントの間のルイスシグナリングゲームとして、視覚言語によるコントラスト学習を再構成した。 CC3MとCC12Mでトレーニングしたモデルでは,SugarCrepeベンチマークで標準CLIPを4.7%,4.0%改善した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:57:31 GMT)
Optimal Bell inequalities for qubit-qudit systems [45.0]
汎用量子キューディットシステムに対するベルの最大値違反を評価し,任意のキューディット次元で容易に計算可能な式を得る。また、この違反に対して単純な下限と上限を与え、クディット・ヒルベルト空間をより大きな次元の1つに埋め込むことでベル違反量を改善する可能性について研究する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:40:57 GMT)
Understanding Video Transformers via Universal Concept Discovery [44.9]
我々は,自動で発見される高レベルな時間的概念に基づいて,トランスフォーマーの意思決定プロセスを説明する。本稿では,VTCD(Video Transformer Concept Discovery)アルゴリズムについて紹介する。結果として生じる概念は高度に解釈可能であり、非構造化ビデオモデルにおける時間的推論機構とオブジェクト中心の表現を明らかにする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:54:50 GMT)
Using Interpretation Methods for Model Enhancement [44.3]
モデルを強化するために,解釈手法と金の合理性を利用する枠組みを提案する。私たちのフレームワークは、様々な解釈手法を組み込むことができるという意味で、非常に一般的なものです。実験結果から,本フレームワークは特に低リソース環境において有効であることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:10:29 GMT)
3D Congealing: 3D-Aware Image Alignment in the Wild [44.3]
3D Congealingは、意味的に類似したオブジェクトをキャプチャする2D画像の3D対応アライメントの問題である。形状テンプレートやポーズ,あるいは任意のカメラパラメータを仮定することなく,タスクに対処する一般的なフレームワークを導入する。我々のフレームワークは、対応マッチング、ポーズ推定、画像編集といった様々なタスクに利用できる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:32:12 GMT)
HOI-M3:Capture Multiple Humans and Objects Interaction within Contextual Environment [43.6]
HOI-M3は、複数のhumanと複数のオブジェクトの相互作用をモデル化するための、新しい大規模データセットである。密集したRGBとオブジェクト搭載IMU入力から、人間と物体の両方の正確な3Dトラッキングを提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:34:09 GMT)
Two-Phase Multi-Dose-Level PET Image Reconstruction with Dose Level Awareness [43.5]
線量レベルの認識が可能な新しい二相多段PET再構成アルゴリズムを設計する。事前学習フェーズは、きめ細かい識別特徴と効果的な意味表現の両方を探索するために考案された。 SPET予測フェーズは、事前学習した線量レベルを利用した粗い予測ネットワークを採用して予備結果を生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:57:08 GMT)
NLP Systems That Can't Tell Use from Mention Censor Counterspeech, but Teaching the Distinction Helps [43.4]
問題のある内容に反論する対訳は、しばしば有害な言語に言及するが、それ自体は有害ではない。最近の言語モデルでさえ、言及と使用の区別に失敗していることを示す。この失敗は、誤報とヘイトスピーチ検出という2つの重要な下流タスクに伝播する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:36:41 GMT)
Continuous Spiking Graph Neural Networks [43.3]
連続グラフニューラルネットワーク(CGNN)は、既存の離散グラフニューラルネットワーク(GNN)を一般化する能力によって注目されている。本稿では,2階ODEを用いたCOS-GNNの高次構造について紹介する。我々は、COS-GNNが爆発や消滅の問題を効果的に軽減し、ノード間の長距離依存関係を捕捉できるという理論的証明を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:36:40 GMT)
Efficient End-to-End Visual Document Understanding with Rationale Distillation [43.3]
Rationale Distillation (RD)は、理性と答えの両方を予測するために、小さな学生モデルを訓練する。 RDは、計算コストが1%高いだけで、4-5%の絶対精度でベースモデルを上回っている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:11:50 GMT)
3D Scene Generation from Scene Graphs and Self-Attention [43.1]
本稿では,シーングラフとフロアプランから3次元シーンを合成する条件付き変分オートエンコーダ(cVAE)モデルを提案する。我々は、シーン内のオブジェクト間の高レベルな関係をキャプチャするために、自己注意層の特性を利用する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:26:17 GMT)
AAA: an Adaptive Mechanism for Locally Differential Private Mean Estimation [43.0]
ローカルディファレンシャルプライバシ(LDP)は、一般的なソフトウェアシステムで採用されている強力なプライバシ標準である。本稿では, 平均効用に対処する分布認識手法である, 適応型アダプティブ (AAA) 機構を提案する。我々は、厳密なプライバシー証明、ユーティリティ分析、そしてAAAと最先端のメカニズムを比較した広範な実験を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:22:07 GMT)
FashionEngine: Interactive Generation and Editing of 3D Clothed Humans [42.9]
FashionEngineを使えば、3Dのデジタル人間を、人間が世界と対話する方法に合わせてデザインできる。事前学習された3次元人体拡散モデルは、2次元画像トレーニングデータからセマンティックUV潜在空間内の3次元人間をモデル化する。マルチモーダルなUVアラインド・サンプラーは、マルチモーダルなユーザ入力に先立つ拡散から高品質で多様な3D人間をサンプリングすることを学ぶ。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:56:17 GMT)
PRISM-TopoMap: Online Topological Mapping with Place Recognition and Scan Matching [42.7]
本稿では,局所的な位置のグラフを保持するトポロジカルマッピング手法であるPRISM-TopoMapを紹介する。提案手法は,ローカライゼーションとループ閉鎖のためのスキャンマッチングパイプラインと組み合わせた学習可能なマルチモーダル位置認識を含む。提案手法の広範な実験的評価を,写真実写環境および実ロボット上で行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:25:16 GMT)
MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response [42.7]
MusiLingoは音楽キャプション生成と音楽関連クエリ応答のための新しいシステムである。広範囲な音楽キャプションデータセットでトレーニングし、インストラクショナルデータで微調整する。音楽キャプションの生成と音楽関連Q&Aペアの構成において,その競争性能を実証した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:35:59 GMT)
Improving Bird's Eye View Semantic Segmentation by Task Decomposition [42.6]
元のBEVセグメンテーションタスクを,BEVマップ再構成とRGB-BEV機能アライメントという2つの段階に分割する。我々のアプローチは、知覚と生成を異なるステップに組み合わせることの複雑さを単純化し、複雑で挑戦的なシーンを効果的に扱うためのモデルを構築します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:19:45 GMT)
Analysis of optical loss thresholds in the fusion-based quantum computing architecture [41.9]
集積フォトニック実装において、現在達成可能なレベルの光学損失を伴って、フォールトトレラント量子コンピューティングが可能であることを示す。この結果から,FBQCモデルにおけるフォールトトレラント量子コンピューティングは,集積フォトニック実装において現在達成可能なレベルの光損失を伴って実現可能であることが示された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:42:58 GMT)
Diffusion Deepfake [41.6]
生成AIの最近の進歩は、主に拡散モデルを通じて、現実世界のディープフェイク検出において大きな課題を呈している。画像の詳細、多様なコンテンツ、そして一般大衆への幅広いアクセス性におけるリアリズムの増加は、これらの洗練されたディープフェイクの識別を複雑にしている。本稿では,最先端拡散モデルにより生成された2つの広範囲なディープフェイクデータセットを紹介する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:17:50 GMT)
TAO-Amodal: A Benchmark for Tracking Any Object Amodally [41.5]
TAO-Amodalは,数千の動画シーケンスにおいて833の多様なカテゴリを特徴とする。私たちのデータセットには、カメラフレームから部分的に外れたものを含む、可視または部分的に、あるいは完全に隠されたオブジェクトのための、テクスタモーダルおよびモーダルバウンディングボックスが含まれています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:09:22 GMT)
An Entropy-based Text Watermarking Detection Method [41.4]
本研究では,エントロピーを用いた透かし検出(EWD)を提案する。提案手法は,低エントロピーシナリオにおいてより優れた検出性能を達成でき,また,本手法は汎用的であり,異なるエントロピー分布を持つテキストにも適用可能である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:31:27 GMT)
Lookahead Exploration with Neural Radiance Representation for Continuous Vision-Language Navigation [41.4]
ビジョン・アンド・ランゲージナビゲーション(VLN)は、エージェントが3D環境における自然言語の指示に従って遠隔地へ移動できるようにする。より良い航法計画のために、ルックアヘッド探索戦略は、候補地の将来環境を正確に予測し、エージェントの次の行動を効果的に評価することを目的としている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:36:03 GMT)
Distributional Drift Adaptation with Temporal Conditional Variational Autoencoder for Multivariate Time Series Forecasting [41.2]
本稿では,時間経過に伴う動的分布依存をモデル化するための時間的条件変動自動符号化(TCVAE)を提案する。 TCVAEは、依存関係を時間的条件分布として推論し、潜伏変数を活用する。現状のMTS予測ベースラインに対して,TCVAEの強靭性と有効性を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:58:50 GMT)
Length Extrapolation of Transformers: A Survey from the Perspective of Positional Encoding [41.0]
Transformerは、生まれてから嵐によって自然言語処理(NLP)の分野に進出してきた。大きな言語モデル(LLM)は、その優れた能力のために世界中で注目を集めている。これらの強力なLLMを含むトランスフォーマーベースのモデルは全て、プリセットされた長さ制限に悩まされており、短いトレーニングシーケンスからより長い推論シーケンスへの一般化は困難である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:56:52 GMT)
TeleChat Technical Report [40.9]
我々は、30億、70億、120億のパラメータを持つ大規模言語モデル(LLM)のコレクションであるTeleChatを提示する。事前訓練された言語モデルと、人間の好みに合わせて微調整されたチャットモデルが含まれている。言語理解,数学,推論,コード生成,知識に基づく質問応答など,様々なタスクにおけるTeleChatの性能を評価する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:45:11 GMT)
DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive Learning [40.9]
VLN(Vision-and-Language Navigation)は、エージェントが自然言語の指示に従うことで、見えない環境でナビゲートする必要がある。タスク完了のためには、エージェントは、指示、観察、ナビゲーション履歴を含む様々なナビゲーションモダリティを調整および統合する必要がある。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:40:04 GMT)
This Land is {Your, My} Land: Evaluating Geopolitical Biases in Language Models [40.6]
大規模言語モデル (LLM) では, 異なる言語を問うと, 地理的知識が不整合に記憶されることが示されている。対象とするケーススタディとして、本質的に議論の的かつ多言語的な課題である領土紛争を考察する。本稿では,様々な言語における応答のバイアスと一貫性を正確に定量化するための評価指標を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:55:33 GMT)
Exploring Automated Distractor Generation for Math Multiple-choice Questions via Large Language Models [40.5]
マルチチョイス質問(MCQ)は、評価や実践において、管理しやすく、格付けし、信頼性の高いフォーマットであるため、ほぼ全てのレベルの教育においてユビキタスである。 MCQの最も重要な側面の1つは、実際の学生の間でよくある誤りや誤解を狙った誤った選択肢である。現在まで、高品質なイントラクタを開発するというタスクは、拡張性に制限のある教師や学習コンテンツデザイナにとって、労働力と時間を要するプロセスのままである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:31:58 GMT)
AddSR: Accelerating Diffusion-based Blind Super-Resolution with Adversarial Diffusion Distillation [40.5]
低分解能入力からの複雑な詳細で鮮明な高分解能画像の再構成における, 安定拡散ショーケースに基づくブラインド超解像法本稿では, 蒸留とコントロールネットの両方のアイデアを取り入れたAddSRを設計し, 特に, 学生モデル出力の高頻度情報に限界的な追加時間コストで予測に基づく自己補正戦略を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:07:38 GMT)
Neuromorphic Wireless Device-Edge Co-Inference via the Directed Information Bottleneck [40.4]
デバイスエッジコ推論は、セマンティックタスクがデバイスとエッジサーバの間で分割される場所である。我々はニューロモルフィック無線デバイスエッジコ推論と呼ばれる新しいシステムソリューションを導入する。提案システムは,通信オーバヘッドの低減を目的とした送信者中心の情報理論基準を用いて設計されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:06:21 GMT)
Efficient 3D Implicit Head Avatar with Mesh-anchored Hash Table Blendshapes [40.4]
ニューラルな暗黙の表現で構築された3Dヘッドアバターは、前例のないレベルのフォトリアリズムを達成した。本研究では,高速な3次元暗黙的頭部アバターモデルを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:55:50 GMT)
Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering [40.3]
Triadは、KBQAタスクに3つの役割を持つLLMベースのエージェントを利用する統一フレームワークである。我々のフレームワークは、エージェントの複数の役割の協調を含む4つのフェーズで実行される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:23:44 GMT)
Distributed Autonomous Swarm Formation for Dynamic Network Bridging [40.3]
離散化された部分観測可能なマルコフ決定過程(Dec-POMDP)における動的ネットワークブリッジ問題について定式化する。グラフ畳み込み強化学習(DGN)に基づく問題に対するマルチエージェント強化学習(MARL)アプローチを提案する。提案手法はシミュレーション環境で評価し,将来性を示す集中型ベースラインと比較した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:45:03 GMT)
Scene Adaptive Sparse Transformer for Event-based Object Detection [40.0]
イベントベースオブジェクト検出のためのSAST(Scene Adaptive Sparse Transformer)を提案する。 SASTはウィンドウツーケンコスパーシフィケーションを可能にし、フォールトトレランスを大幅に向上し、計算オーバーヘッドを低減する。 2つの大規模イベントベースのオブジェクト検出データセットのパフォーマンスと効率の両方において、他の高密度でスパースなネットワークよりも優れています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:15:25 GMT)
Long-context LLMs Struggle with Long In-context Learning [39.8]
大規模言語モデル(LLM)は32Kトークンを超える長いシーケンスを扱うために大きな進歩を遂げた。本研究は,極端ラベル分類の領域内での長い文脈内学習に焦点を当てた特殊なベンチマーク(liconBench)を紹介する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:59:11 GMT)
SemEval Task 1: Semantic Textual Relatedness for African and Asian Languages [39.8]
意味的テクスト関連性(STR)に関する最初の共有課題を提示する。 14言語にまたがる意味的関連性の広範な現象について検討する。これらの言語は5つの異なる言語族の出身であり、主にアフリカとアジアで話されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:26:00 GMT)
Imitation Game: A Model-based and Imitation Learning Deep Reinforcement Learning Hybrid [39.6]
本稿では,モデルに基づくDeep Reinforcement Learningと模倣学習を組み合わせたハイブリッドエージェントアーキテクチャへの取り組みについて述べる。本稿では,モデルに基づくDeep Reinforcement Learningと模倣学習を組み合わせたハイブリッドエージェントアーキテクチャへの取り組みについて述べる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:55:30 GMT)
Is attention required for ICL? Exploring the Relationship Between Model Architecture and In-Context Learning Ability [39.4]
そこで本研究では,テキスト内学習タスクのスイート間で因果言語モデリングが可能な13のモデルを評価する。検討されたアーキテクチャはすべて、以前文書化されたよりも幅広い条件下でコンテキスト内学習を行うことができる。いくつかの注意すべき代替手段は、トランスフォーマーよりもコンテキスト内学習者と競合することがある。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:54:53 GMT)
Unlocking Structure Measuring: Introducing PDD, an Automatic Metric for Positional Discourse Coherence [39.1]
本稿では,2つの長文間の談話の相違を定量化する手法を提案する。ヒトの嗜好やGPT-4のコヒーレンス評価とより密接に一致し,既存の評価方法よりも優れていた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:51:36 GMT)
On the Role of Summary Content Units in Text Summarization Evaluation [39.1]
文章要約コンテンツ単位(SCU)を近似する2つの新しい戦略を示す。 STUとSMUは競合するが、最高の近似品質はSGUによって達成される。また、簡単な文分解ベースライン(SSU)を通して、SCUが短い要約をランク付けする際に最も価値を提供するが、ランキングシステムや長い要約ではそれほど役に立たないことを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:09:44 GMT)
GEARS: Local Geometry-aware Hand-object Interaction Synthesis [38.8]
本研究では, 相互作用領域近傍の局所物体形状を推定するための, 結合中心型センサを提案する。学習の複雑さを軽減するための重要なステップとして、グローバルフレームからテンプレートハンドフレームにポイントを変換し、共有モジュールを使用して各関節のセンサ特徴を処理する。これに続いて、異なる次元の関節間の相関を捉えることを目的とした知覚時間変換ネットワークが提供される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:18:52 GMT)
Coherent Control of an Optical Quantum Dot Using Phonons and Photons [38.7]
光学的2レベルシステム(qubits)の独特な利点を光学学に示す。クビット状態は、多種多様な駆動スキームを用いてコヒーレントに制御できる。マイクロ波-光プロセスにおける信号-背景散乱を改善する方法を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:25:35 GMT)
Ignore Me But Don't Replace Me: Utilizing Non-Linguistic Elements for Pretraining on the Cybersecurity Domain [38.5]
サイバーセキュリティ情報はしばしば技術的に複雑で、構造化されていないテキストを通して中継される。高レベルの専門知識を持つテキストドメインでは、ドメイン内のコーパスを事前訓練することが、ドメインの専門知識を得るための言語モデルとして一般的な方法である。我々は,異なる事前学習手法を提案し,下流タスクと探索タスクを通してその効果を評価する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:46:42 GMT)
Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks [38.3]
近年のLLMでさえ、単純な適応型ジェイルブレイク攻撃に対して堅牢ではないことが示されている。ジェイルブレイクのためのログプロブへのアクセスをうまく活用する方法を実証する。 100%の成功率で、転送またはプリフィル攻撃のいずれかを通じて、Crudeモデル -- ログプロブを公開していない -- をジェイルブレイクする方法を示します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:58:27 GMT)
A Linear Time and Space Local Point Cloud Geometry Encoder via Vectorized Kernel Mixture (VecKM) [37.9]
VecKMは、記述的で、効率的で、ノイズに対して堅牢な、新しいローカルポイント・クラウド・ジオメトリ・エンコーダである。 VecKMは計算とメモリコストを$O(n2+nKd)$から$O(nd)$に下げる試みとして初めて成功した。 VecKMは100倍高速な推論速度だけでなく、最も強い記述性を示し、既存のエンコーダと比較する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:01:21 GMT)
HIPTrack: Visual Tracking with Historical Prompts [37.9]
シームズパラダイムに忠実かつ更新された履歴情報を追従するトラッカーを提供することにより,大幅な性能向上が達成できることを示す。我々は,履歴プロンプトネットワークに基づくHIPTrackと呼ばれる新しいトラッカーを構築し,モデル全体を再トレーニングすることなく,大幅な性能向上を実現した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:00:38 GMT)
Improved Text Emotion Prediction Using Combined Valence and Arousal Ordinal Classification [37.8]
テキストから感情を分類する手法を導入し,様々な感情の相違点と相違点を認識・区別する。提案手法は感情予測において高い精度を保ちながら,誤分類の場合の誤りの程度を著しく低減する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:06:30 GMT)
How Trustworthy are Open-Source LLMs? An Assessment under Malicious Demonstrations Shows their Vulnerabilities [37.1]
我々は,オープンソースのLarge Language Models (LLMs) の信頼性に対する敵意評価を行う。本稿では,信頼度攻撃のための悪質なデモンストレーションを慎重に行うことで,CoUの促進戦略であるAdvCoUを提案する。我々の実験は、Vicuna、MPT、Falcon、Mistral、Llama 2など、最近のオープンソースのLLMシリーズを網羅している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:21:55 GMT)
Generative AI for Immersive Communication: The Next Frontier in Internet-of-Senses Through 6G [37.1]
感覚のインターネット(Internet of Senses, IoS)は、多感覚体験を提供することを目指しており、私たちの物理的現実において、私たちの知覚は単なる視覚と音以上のものであることを認識している。本稿では,没入型マルチ感覚メディアを駆動する既存の技術について考察し,その能力と応用の可能性について考察する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:57:05 GMT)
SeiT++: Masked Token Modeling Improves Storage-efficient Training [37.0]
近年のDeep Neural Network(DNN)モデルでは,コンピュータビジョンタスクのパフォーマンスが大幅に向上している。高度に一般化可能で高性能なビジョンモデルを実現するには、拡張データセットが必要である。 Seit氏は、視覚分類のためのネットワーク入力としてVector-Quantized (VQ)特徴ベクトル(トークン)の使用を提案している。本稿では,自己指導型事前学習のためのMasked Token Modeling (MTM)を統合し,SeyTを拡張した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:10:13 GMT)
Towards Robust 3D Pose Transfer with Adversarial Learning [36.4]
望ましいポーズをターゲットメッシュに転送することを目的とした3Dポーズ転送は、最も困難な3D生成タスクの1つである。以前の試みは、よく定義されたパラメトリックな人体モデルや骨格関節を駆動するポーズ源として頼っていた。 3次元外部プレゼンテーション(ポーズ)を効果的に学習するカスタマイズされたMAEである3D-PoseMAEを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:03:39 GMT)
CHAIN: Enhancing Generalization in Data-Efficient GANs via lipsCHitz continuity constrAIned Normalization [36.2]
バッチ正規化(BN)は、データ効率のよいGANの識別にはほとんど使われていない。我々は、従来の中心ステップをゼロ平均正規化に置き換え、スケーリングステップでリプシッツ連続性制約を統合するCHAINを提案する。 CHAINは、CIFAR-10/100、ImageNet、5つのローショット、7つの高解像度のショットイメージデータセット上のデータ制限シナリオにおいて、最先端の結果を達成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:15:34 GMT)
Minimize Quantization Output Error with Bias Compensation [35.4]
量子化は、ディープニューラルネットワーク(DNN)のメモリ使用量と計算強度を低減する有望な方法である本稿では,出力誤差を定量化せずに精度を向上する手法を提案する。視覚モデルと大規模言語モデルの実験を行う。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:29:31 GMT)
Using Large Language Models to Understand Telecom Standards [35.3]
大きな言語モデル(LLM)は、関連する情報へのより高速なアクセスを提供する。質問応答(QA)アシスタントとして使用される最先端のLCMの性能を評価する。その結果,LLMはテレコム技術文書の信頼できる参照ツールとして利用できることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:54:51 GMT)
More Samples or More Prompts? Exploring Effective In-Context Sampling for LLM Few-Shot Prompt Engineering [35.1]
In-Context Smpling (ICS) を提案し、複数のICLプロンプト入力の構成を最適化し、確実な予測を行う。 3つのデータ類似性に基づくICS戦略による詳細な評価は、これらの戦略がLLMの性能をさらに高める可能性があることを示唆している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:16:40 GMT)
Is Meta-training Really Necessary for Molecular Few-Shot Learning ? [35.0]
わずかながらの学習は、薬物発見に大きな関心を惹きつけており、近年急速に成長している文献は、主に複雑なメタラーニング戦略を含んでいる。分子データに対するより簡単な微調整手法を再検討し、マハラノビス距離に基づく正規化二次プローブ損失を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:20:51 GMT)
MMCert: Provable Defense against Adversarial Attacks to Multi-modal Models [34.8]
我々は,マルチモーダルモデルに対する敵攻撃に対する最初の認証された防御であるMCCertを提案する。我々は,マルチモーダル道路セグメンテーションタスクとマルチモーダル道路セグメンテーションタスクと,マルチモーダル感情認識タスクの2つのベンチマークデータセットを用いて,MCCertを評価した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:05:46 GMT)
Vulnerabilities of Foundation Model Integrated Federated Learning Under Adversarial Threats [34.5]
フェデレートラーニング(FL)は、データプライバシとセキュリティに関連する機械学習における重要な問題に対処するが、特定の状況下でのデータ不足と不均衡に悩まされる。ファンデーションモデル(FM)の出現は、既存のFLフレームワークの制限に対する潜在的な解決策を提供する。 FM統合FL(FM-FL)の脆弱性を敵の脅威下で調査した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:31:24 GMT)
HeMeNet: Heterogeneous Multichannel Equivariant Network for Protein Multitask Learning [34.0]
本稿では,3次元タンパク質構造の入力に基づいて,複数のタスクを協調的に処理するニューラルネットワークモデルを提案する。特に,我々はまず,Protein-MTと呼ばれる標準構造に基づくマルチタスクベンチマークを構築した。そこで我々は,HeMeNet(Heterogeneous Multi Channel Equivariant Network)と呼ばれる,マルチタスク学習のための新しいグラフニューラルネットワークを開発した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:53:45 GMT)
JRDB-PanoTrack: An Open-world Panoptic Segmentation and Tracking Robotic Dataset in Crowded Human Environments [33.9]
JRDB-PanoTrackは,ロボットシステムにおける環境理解のためのオープンワールド・パノプティクス・セグメンテーションとトラッキング・ベンチマークである。 JRDB-PanoTrackは,1)屋内および屋外の混雑シーンを含む各種データと,総合的な2Dおよび3D同期データモダリティを含む。クローズドおよびオープンワールド認識ベンチマーク用のさまざまなオブジェクトクラス、評価のためのOSPAベースのメトリクス。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:43:22 GMT)
READ: Improving Relation Extraction from an ADversarial Perspective [33.4]
関係抽出(RE)に特化して設計された対角的学習法を提案する。提案手法では,シーケンスレベルの摂動とトークンレベルの摂動の両方をサンプルに導入し,個別の摂動語彙を用いてエンティティとコンテキストの摂動の探索を改善する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:42:44 GMT)
T-VSL: Text-Guided Visual Sound Source Localization in Mixtures [33.3]
視覚的音源定位は、ビデオ内の各音源の意味領域を特定する上で重要な課題となる。既存の教師付きおよび弱教師付きソースローカライゼーション手法では,各音源対象の意味領域を正確に識別することが困難である。テキストモダリティを3モーダル結合埋め込みモデル(例:AudioCLIP)を用いて中間的特徴ガイドとして組み込むことにより,マルチソース混合における意味的音声・視覚的ソース対応を解消する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:07:05 GMT)
PKU-DyMVHumans: A Multi-View Video Benchmark for High-Fidelity Dynamic Human Modeling [33.0]
PKU-DyMVHumansは高忠実度再構成と動的人間のシナリオのレンダリングのための汎用的な人間中心のデータセットである。フレーム数は820万フレームで、56台以上のカメラが様々なシナリオで同期している。ニューラルフィールド(NeRF)に基づくシーン表現の最近の進歩に触発されて、私たちは、オフザシェルフフレームワークを慎重にセットアップした。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:16:05 GMT)
Language Model Guided Interpretable Video Action Reasoning [33.0]
我々はLanguage-guided Interpretable Action Recognition framework (LaIAR)という新しいフレームワークを提案する。 LaIARは、言語モデルからの知識を活用して、認識能力とビデオモデルの解釈可能性の両方を強化する。本質的には、ビデオモデルと言語モデルを整合させるタスクとして、ビデオモデル決定を理解することの問題を再定義する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:31:13 GMT)
Code-Aware Prompting: A study of Coverage Guided Test Generation in Regression Setting using LLM [32.4]
テスト生成における大規模言語モデルのコード認識促進戦略であるSymPromptを提案する。 SymPromptは、正しいテスト世代を5倍に増やし、CodeGen2の相対カバレッジを26%向上させる。特に、GPT-4に適用すると、SymPromptはベースラインのプロンプト戦略に比べて2倍以上のカバレッジが向上する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:23:03 GMT)
SVGDreamer: Text Guided SVG Generation with Diffusion Model [31.8]
SVGDreamerと呼ばれる新しいテキスト誘導ベクトルグラフィックス合成法を提案する。 SIVEプロセスは、前景オブジェクトと背景への合成の分解を可能にする。 VPSDアプローチは、形状の平滑化、彩度の過飽和、多様性の制限、収束の遅い問題に対処する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:25:04 GMT)
Linear Combination of Saved Checkpoints Makes Consistency and Diffusion Models Better [31.7]
Diffusion Models (DM) と Consistency Models (CM) は、様々なタスクにおいて優れた生成品質を持つ人気のある生成モデルである。本研究では,SGDでは到達できないが,適切なチェックポイント平均化によって得られるような,高品質なモデルウェイトがしばしば存在することを明らかにする。進化探索から導出される係数とトレーニング軌道に沿ったチェックポイントを組み合わせることで,DMとCMの性能を向上させる,シンプルで効率的かつ効率的なLCSCを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:59:39 GMT)
Variance-Reduced Policy Gradient Approaches for Infinite Horizon Average Reward Markov Decision Processes [31.3]
無限水平平均報酬マルコフ決定過程の文脈におけるパラメータ化を一般化した2つのポリシーグラディエントに基づく手法を提案する。第一のアプローチはインプリシット・グラディエント・トランスポート (Implicit Gradient Transport) を使い、$tildemathcalO(T3/5)$の注文を確実に後悔する。第2のアプローチは、ヘッセンの手法をルーツとするもので、$tildemathcalO(sqrtT)$を期待された後悔を保証する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:08:23 GMT)
Self-Improvement Programming for Temporal Knowledge Graph Question Answering [31.3]
時間的知識グラフ質問回答(TKGQA)は、時間的知識グラフ(TKG)に対する時間的意図で質問に答えることを目的としている。既存のエンドツーエンドの手法は、質問や候補者の回答の埋め込みを学習することで、時間制約を暗黙的にモデル化する。 TKGQA(Prog-TQA)のための新しい自己改善プログラミング手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:14:27 GMT)
MaskINT: Video Editing via Interpolative Non-autoregressive Masked Transformers [30.9]
最先端のアプローチは主にこれらのタスクを達成するために拡散モデルに依存している。本稿では,テキストベースのビデオ編集タスクを2段階に分割する。まず、事前訓練されたテキスト・画像拡散モデルを用いて、ゼロショット方式で少数者を同時に編集する。第2に,非自己回帰マスク生成変換器をベースとしたMaskINTという効率的なモデルを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:00:11 GMT)
Joint-Task Regularization for Partially Labeled Multi-Task Learning [30.8]
機械学習分野ではマルチタスク学習がますます人気になっているが、その実用性は大規模ラベル付きデータセットの必要性によって妨げられている。本稿では, クロスタスク関係を利用して, 全タスクを1つのジョイントタスク潜在空間で同時に正規化する直感的手法であるジョイントタスク正規化(JTR)を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:16:59 GMT)
PersonaLLM: Investigating the Ability of Large Language Models to Express Personality Traits [30.8]
本研究では,ビッグファイブ・パーソナリティ・モデルに基づく大規模言語モデル(LLM)の行動について検討する。その結果, LLMペルソナの自己申告したBFIスコアは, 指定した性格タイプと一致していることがわかった。人間の評価は、人間は最大80%の精度でいくつかの性格特性を知覚できることを示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:06:53 GMT)
Is Mamba Effective for Time Series Forecasting? [30.2]
状態空間モデル(SSM)は、シーケンス内の複雑な依存関係を処理する能力によって、注目を集めている。時系列予測のための,S-Mamba(S-Mamba)というマンバモデルを提案する。いくつかのデータセットの実験では、S-Mambaは計算オーバーヘッドを低く保ち、主要な性能を達成している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:03:37 GMT)
Volcano: Mitigating Multimodal Hallucination through Self-Feedback Guided Revision [29.9]
Volcanoはマルチモーダルなセルフフィードバックガイド付きリビジョンモデルである。マルチモーダル幻覚を効果的に低減し、MMHal-Bench、POPE、GAVIEの最先端を達成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:12:43 GMT)
GPT-Fathom: Benchmarking Large Language Models to Decipher the Evolutionary Path towards GPT-4 and Beyond [29.8]
GPT-Fathomは、OpenAI Evals上に構築された大規模言語モデル(LLM)のための、オープンソースで再現可能な評価スイートである。私たちは,7つの機能カテゴリにまたがる20以上のベンチマークで,10以上のLLMとOpenAIのレガシモデルを評価しました。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:51:38 GMT)
Face It Yourselves: An LLM-Based Two-Stage Strategy to Localize Configuration Errors via Logs [29.7]
コンフィグレーションエラーはメンテナと新しいエンドユーザにとって大きな課題となる。ログがほとんどのエンドユーザに容易にアクセス可能であることを考慮し、設定エラーのローカライズにログを利用する際の課題と機会を概説する予備的研究を行う。予備研究から得られた知見に基づいて,エンドユーザーがログに基づいて根源構成特性をローカライズするためのLLMベースの2段階戦略を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:53:41 GMT)
Constrained Robotic Navigation on Preferred Terrains Using LLMs and Speech Instruction: Exploiting the Power of Adverbs [29.5]
本稿では,生成AIを用いた地図のないオフロードナビゲーションにおける大規模言語モデルの活用について検討する。本稿では,ロボットがWhisperを通じてテキストに変換された音声命令を受信し,ランドマークや好地,重要な副詞を抽出し,制限されたナビゲーションのための速度設定に変換する手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:46:13 GMT)
A Rationale-centric Counterfactual Data Augmentation Method for Cross-Document Event Coreference Resolution [29.3]
構造因果モデル(SCM)を用いたベースラインECRシステムの意思決定過程を定式化する。 LLM-in-the-loop を用いた有理中心の反実データ拡張法を開発した。提案手法は,3つのクロスドキュメント ECR ベンチマークの最先端性能を実現し,ドメイン外シナリオの堅牢性を実証する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:15:07 GMT)
Iterative Refinement of Project-Level Code Context for Precise Code Generation with Compiler Feedback [29.1]
大規模言語モデル(LLM)は、コードの自動生成において顕著な進歩を示している。しかし、LLMベースのコード生成を実際のソフトウェアプロジェクトに組み込むことが課題となっている。本稿では,プロジェクトレベルのコードコンテキストを反復的に洗練するProCoderという新しいアプローチを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:17:12 GMT)
Cross-modality debiasing: using language to mitigate sub-population shifts in imaging [28.9]
サブポピュレーションシフトは、アルゴリズムバイアスの重要な源であり、分散ロバスト性を要求する。近年の研究では、視覚言語モデルCLIPのような多モード基礎モデルに固有の分布ロバスト性が確認されている。本稿では,画像特徴表現の劣化を抑えるために自然言語入力を活用することを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:47:23 GMT)
GraphInstruct: Empowering Large Language Models with Graph Understanding and Reasoning Capability [28.7]
大規模言語モデル(LLM)のグラフ理解能力の評価と向上を行う。本稿では,21の古典的グラフ推論タスクを含むGraphInstructというベンチマークを提案する。我々は,グラフ理解能力の顕著な向上を示す効率的な命令チューニングにより,GraphLMを構築する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:57:16 GMT)
Where to Move Next: Zero-shot Generalization of LLMs for Next POI Recommendation [28.6]
Next Point-of-interest (POI)レコメンデーションは、ユーザが周囲の環境を探索するための貴重な提案を提供する。既存の研究は、大規模ユーザのチェックインデータからレコメンデーションモデルを構築することに依存している。近年,事前訓練された大規模言語モデル (LLM) は,様々なNLPタスクにおいて大きな進歩を遂げている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:33:04 GMT)
MapGuide: A Simple yet Effective Method to Reconstruct Continuous Language from Brain Activities [28.5]
そこで本研究では,脳活動からマッピングしたテキスト埋め込みとの比較により,テキスト再構成を誘導する手法を提案する。その結果, BLEUとMETEORでは平均77%, 54%の改善が見られた。このような洞察は、将来の作業のために脳の活動から言語を再構築する作業を単純化することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:05:41 GMT)
Do Localization Methods Actually Localize Memorized Data in LLMs? A Tale of Two Benchmarks [28.5]
2つのベンチマークは、記憶データに責任があるコンポーネントをピンポイントするローカライズ手法の能力を評価する。異なる視点にもかかわらず、我々の2つのベンチマークは5つのローカライゼーション手法の一貫性のあるランキングを得る。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:32:40 GMT)
How to Teach Programming in the AI Era? Using LLMs as a Teachable Agent for Debugging [28.3]
大規模言語モデル(LLM)は、生成スキルに優れ、実行不可能な速度でコンテンツを作成することができる。人間の初心者は、教師アシスタントの役割を担い、LLMで教えられるエージェントのコードを支援する。そこで我々は,人間の初心者が指導アシスタントの役割を担い,LLMを利用した学習エージェントのコード作成を支援する,デバッグの意図的な実践を促進する新しいシステムであるPhyを紹介した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:57:02 GMT)
Two Heads are Better than One: Nested PoE for Robust Defense Against Multi-Backdoors [28.3]
既存の防御機構は、攻撃者が採用するトリガーの種類は1つしかないと仮定する。本研究では,Nested Product of Experts(NPoE)防衛フレームワークを提案する。 NPoEは、別々に、およびトリガー混合物において、様々なトリガーに対して効果的に防御する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:58:38 GMT)
IndoCulture: Exploring Geographically-Influenced Cultural Commonsense Reasoning Across Eleven Indonesian Provinces [28.2]
本稿では,言語モデル推論能力に対する地理的要因の影響を理解することを目的としたIndoCultureを紹介する。テンプレートやオンラインスクレイピングに依存していた以前の作業とは対照的に、ローカルの人たちに、コンテキストと妥当なオプションを手作業で開発するように頼んで、IndoCultureを作りました。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:32:58 GMT)
TAMM: TriAdapter Multi-Modal Learning for 3D Shape Understanding [28.1]
TriAdapter Multi-Modal Learning (TAMM)は3つの相乗的アダプタに基づく新しい2段階学習手法である。 TAMMは、広範囲の3Dエンコーダアーキテクチャ、事前トレーニングデータセット、下流タスクの3D表現を一貫して強化する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:50:34 GMT)
Learning Equi-angular Representations for Online Continual Learning [28.0]
特に, 神経崩壊を誘発し, 表現空間に単純な等角的タイトフレーム(ETF)構造を形成する。提案手法は,様々なオンライン連続学習シナリオにおいて,最先端の手法よりも顕著に優れていることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:29:01 GMT)
VA3: Virtually Assured Amplification Attack on Probabilistic Copyright Protection for Text-to-Image Generative Models [27.8]
我々は,新しいオンラインアタックフレームワークであるVirtually Assured Amplification Attack (VA3)を紹介する。 VA3は、生成モデルとの持続的な相互作用において、侵害するコンテンツを生成する確率を増幅する。これらの知見は,テキスト・ツー・イメージ生成モデルの実践的応用において,確率論的著作権保護を実装する可能性を示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:28:26 GMT)
Transformers as Transducers [27.5]
変換器のシーケンス・ツー・シーケンスマッピング能力について検討する。驚くほど大きなトランスダクションのクラスを表現できることがわかりました。トランスデコーダがチューリング完全であるという新しい証明。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:34:47 GMT)
"It's a Fair Game", or Is It? Examining How Users Navigate Disclosure Risks and Benefits When Using LLM-Based Conversational Agents [27.5]
大規模言語モデル(LLM)ベースの会話エージェント(CA)の普及は、多くのプライバシー上の懸念を引き起こす。実世界のChatGPT会話における機密情報開示を分析し,19名のLCMユーザを対象に半構造化インタビューを行った。 LLMベースのCAを使用する場合,ユーザは常に,プライバシやユーティリティ,利便性のトレードオフに直面しています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:32:06 GMT)
Diffusion 3D Features (Diff3F): Decorating Untextured Shapes with Distilled Semantic Features [27.4]
Diff3Fは、非テクスチャ入力のためのクラスに依存しない特徴記述子である。画像基礎モデルから入力形状への拡散特性を蒸留する。その過程で2次元で(拡散)特徴を生成し、その後、元の表面に持ち上げて集約する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:11:35 GMT)
Asymptotics of Language Model Alignment [27.4]
最適KL制約RL解が大きな偏差原理を満たすことを示す。また、報酬のスケールした累積物の成長速度は、適切なレニイクロスエントロピーによって特徴づけられることを示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:40:07 GMT)
FairRAG: Fair Human Generation via Fair Retrieval Augmentation [27.1]
本稿では,Fair Retrieval Augmented Generation (FairRAG)について紹介する。FairRAGは,外部画像データベースから取得した参照画像に事前学習した生成モデルを条件付けし,人間の生成における公平性を改善するためのフレームワークである。公平性を高めるために、FairRAGは単純なyet- Effective debiasing戦略を適用し、生成過程において多様な人口集団の画像を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:34:22 GMT)
pixelSplat: 3D Gaussian Splats from Image Pairs for Scalable Generalizable 3D Reconstruction [26.7]
pixelSplatは、画像のペアから3次元ガウスプリミティブによってパラメータ化された3次元放射界の再構成を学ぶフィードフォワードモデルである。我々のモデルは、スケーラブルなトレーニングのためのリアルタイム・メモリ効率のレンダリングと、推論時の高速な3次元再構成を特徴としている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:23:16 GMT)
Rethinking Annotator Simulation: Realistic Evaluation of Whole-Body PET Lesion Interactive Segmentation Methods [26.6]
実際のユーザスタディやシミュレートされたアノテータによる対話的セグメンテーションモデルの評価を行う。実際のユーザスタディは高価で大規模に制限されることが多いが、シミュレーションアノテータ(ロボットユーザとしても知られる)はモデルパフォーマンスを過大評価する傾向がある。本稿では,クリック変動やアノテータ間の不一致といった人間的要因を取り入れた,より現実的なロボットユーザを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:19:17 GMT)
AI WALKUP: A Computer-Vision Approach to Quantifying MDS-UPDRS in Parkinson's Disease [26.4]
パーキンソン病(英: Parkinson's Disease、PD)は、神経変性疾患の2番目に多い疾患である。 PDの既存の評価方法は、様々な種類の運動症状と疾患の進行の重症度を評価するために、運動障害協会(英語版) - Unified Parkinson's Disease Rating Scale (MDS-UPDRS) である。我々は、コンピュータビジョンベースのソリューションを使用して、カメラに基づいて人間のポーズ画像をキャプチャし、アルゴリズムを用いて動き分析を再構築し、特徴工学を通して動きの量の特徴を抽出したいと考えている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:53:34 GMT)
Effective internal language model training and fusion for factorized transducer model [26.4]
ニューラルトランスデューサの内部言語モデル(ILM)は広く研究されている。因子化トランスデューサモデルのための新しいILMトレーニングと復号化戦略を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:01:05 GMT)
Steerers: A framework for rotation equivariant keypoint descriptors [26.3]
大きな視点の変化に対して差別的で一致可能なキーポイント記述は、3次元再構成に不可欠である。入力画像の回転を符号化する記述空間における線形変換を学習する。回転不変画像マッチングベンチマークであるAIMSとRoto-360の最先端結果を得た。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:40:33 GMT)
Peer-aided Repairer: Empowering Large Language Models to Repair Advanced Student Assignments [26.2]
我々は,大規模言語モデルを利用したPaRというフレームワークを開発した。 PaRは、ピアソリューション選択、マルチソースプロンプト生成、プログラム修復の3段階で動作する。 Defects4DSと他のよく検証されたTHEPデータセットの評価は、PaRが新しい最先端のパフォーマンスを達成することを明らかにしている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:12:21 GMT)
Identifying Self-Disclosures of Use, Misuse and Addiction in Community-based Social Media Posts [26.2]
我々は,オピオイド使用の6つの異なる位相をラベル付けした,様々なサブレディットからの2500オピオイド関連ポストのコーパスを提示する。すべての投稿で、私たちは、アノテーションの品質とモデル開発の両方において、スパンレベルの説明を注釈付けし、彼らの役割を決定的に研究します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:43:27 GMT)
Generative AI in the Wild: Prospects, Challenges, and Strategies [26.1]
本研究では,総合的LUA(Learning, Using Assessing)フレームワークにおける人間-ゲンカイ共創過程について検討した。 Prospects-GenAIは、人間の専門知識とGenAI能力の共創を大いに促進します。ユーザは、このような課題の多くを克服するために、さまざまな戦略を積極的に考案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:54:04 GMT)
Beyond Accuracy: Evaluating the Reasoning Behavior of Large Language Models -- A Survey [25.7]
大規模言語モデル(LLM)は、最近、推論を含むタスクで顕著なパフォーマンスを示している。これらの成功にもかかわらず、LLMの推論能力の深さは未だ不明である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:46:31 GMT)
CSST Strong Lensing Preparation: a Framework for Detecting Strong Lenses in the Multi-color Imaging Survey by the China Survey Space Telescope (CSST) [25.5]
強い重力レンズはダークマターとダークエネルギー特性を研究する強力なツールである。我々は,階層型視覚変換器をベースとしたスライディングウインドウ技術を用いて,画像全体に強いレンズシステムを求めるフレームワークを開発した。我々のフレームワークは、それぞれ0.98と0.90の精度とリコール率を達成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:44:30 GMT)
Unleash the Potential of CLIP for Video Highlight Detection [25.4]
HL-CLIPは、ビデオハイライト検出タスクを最適化する手法である。ハイライト検出タスクであるQVHighlight Benchmarkでは、最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:01:58 GMT)
CLAPNQ: Cohesive Long-form Answers from Passages in Natural Questions for RAG systems [25.4]
完全なRAGパイプラインのためのロングフォーム質問回答データセットのベンチマークであるClapNQを提示する。 ClapNQの答えは簡潔で、全通より3倍小さく、結束性があり、複数の節は連続しない。本稿では,基礎となるRAGの改善の余地がまだ残っている地域に焦点を当てた,ClapNQのベースライン実験と解析を行う。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:00:11 GMT)
Distributed and Rate-Adaptive Feature Compression [25.4]
線形回帰に対する分散・レート適応的特徴圧縮の問題点について検討する。本稿では,センサデータの1次元投影を定量化する分散圧縮方式を提案する。また,通信制約の変化に対処する簡単な適応方式を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:21:06 GMT)
MotionChain: Conversational Motion Controllers via Multimodal Prompts [25.2]
我々は,マルチモーダルプロンプトによる連続的,長期的人間の動作を生成する対話型ヒューマンモーションコントローラであるMotionChainを紹介する。大規模言語、視覚言語、視覚運動データを活用することで、MotionChainは、マルチターン会話で各命令を理解し、それに続く人間の動きを生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:09:29 GMT)
How Effective Are Neural Networks for Fixing Security Vulnerabilities [25.1]
本稿では LLM と DL ベースの APR モデルの Java 脆弱性修復機能について検討し比較した。結果として、より大きな脆弱性修復トレーニングデータを作成するなど、Javaの自動脆弱性修正を強化するイノベーションが求められている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:48:11 GMT)
Vision-Language Models in Remote Sensing: Current Progress and Future Trends [25.0]
視覚言語モデルは、画像とその関連するテキスト記述の推論を可能にし、基礎となるセマンティクスのより深い理解を可能にする。視覚言語モデルは、RS画像の視覚的認識を超えて、意味的関係をモデル化し、画像の自然言語記述を生成することができる。本稿では,リモートセンシングにおける視覚言語モデルの研究を包括的にレビューする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:52:41 GMT)
FT2Ra: A Fine-Tuning-Inspired Approach to Retrieval-Augmented Code Completion [25.0]
我々は,真の微調整を模倣することを目的とした新しい検索手法FT2Raを開発した。 FT2RaはUniXcoderの最良のベースライン方式に比べて精度が4.29%向上している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:42:15 GMT)
Humanizing Machine-Generated Content: Evading AI-Text Detection through Adversarial Attack [25.0]
そこで本研究では,機械生成コンテンツの小さな摂動を回避して検出を回避すべく,より広いレベルの敵攻撃のためのフレームワークを提案する。我々は、ホワイトボックスとブラックボックスの2つの攻撃設定を検討し、現在の検出モデルのロバスト性を高める可能性を評価するために、動的シナリオにおける逆学習を採用する。実験の結果、現在の検出モデルは10秒で妥協でき、機械が生成したテキストを人間の書き起こしコンテンツとして誤分類する結果となった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:49:22 GMT)
TEMPO: Prompt-based Generative Pre-trained Transformer for Time Series Forecasting [24.8]
本稿では,時系列表現を効果的に学習できる新しいフレームワークTEMPOを提案する。 TEMPOは、様々な領域のデータから現実世界の時間現象を動的にモデル化する機能を拡張する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:39:08 GMT)
Large Human Language Models: A Need and the Challenges [24.6]
大規模人文言語モデル(LHLM)の創出に向けた3つの立場を提唱する。第一に、LMトレーニングには人間の文脈を含めるべきである。第二に、LHLMは、人々が自分のグループ以上であることを認識すべきである。第3に、LHLMは人間の文脈の動的かつ時間的に依存する性質を説明できるべきである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:30:12 GMT)
Towards Generalizable and Faithful Logic Reasoning over Natural Language via Resolution Refutation [24.6]
本稿では,GFaiR(Generalizable and Faithful Reasoner)という新しいフレームワークを提案する。解法の難解化は、推論規則を拡張し、矛盾による証明の原理を採用することによって、全ての一階論理推論問題を解く能力を持つ。我々のシステムは、単純なシナリオでパフォーマンスを維持しながら、複雑なシナリオで最先端のパフォーマンスを達成することで、これまでの作業より優れています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:28:44 GMT)
SLIDE: Reference-free Evaluation for Machine Translation using a Sliding Document Window [24.5]
本稿では,文ブロックで動作するSLIDE(SLIding Document Evaluator)というメトリクスを提案する。 SLIDEは文レベルベースラインよりもペアワイズシステムの精度がかなり高いことがわかった。このことは、ソースの曖昧さを曖昧にするために、ソースコンテキストが人間の参照と同じ情報を提供する可能性があることを示唆している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:36:24 GMT)
EarthNets: Empowering AI in Earth Observation [24.2]
地球観測(EO)は、リモートセンシングデータを用いて惑星地球の状態を監視することを目的としている。本稿では,500以上の公開データセットの総合的なレビューを行う。モデル評価のための新しいベンチマークを構築するために,データセットを計測,ランク付け,選択することを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:45:06 GMT)
ViTamin: Designing Scalable Vision Models in the Vision-Language Era [24.1]
Vision Transformer (ViTs) は、イメージエンコーダのデフォルトの選択肢である。 ViTamin-Lは、ViT-Lを2.0%画像ネットゼロショット精度で大幅に上回る。 436万のパラメータしか持たないViTamin-XLは、82.9%のImageNetゼロショット精度を実現している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:40:29 GMT)
Diffuse, Attend, and Segment: Unsupervised Zero-Shot Segmentation using Stable Diffusion [24.0]
アノテーションを使わずに任意のものをゼロショットでセグメント化できるモデルを提案する。注意マップ間のKLのばらつきを計測し,それらを有効なセグメンテーションマスクにマージする,シンプルで効果的な反復的マージ手法を提案する。 COCO-Stuff-27では,従来の教師なしゼロショットSOTA法を26%,IoU平均17%で上回っている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:40:03 GMT)
eTraM: Event-based Traffic Monitoring Dataset [24.0]
我々は、イベントベースのトラフィック監視データセットであるeTraMを紹介した。 eTraMは、様々な照明と気象条件の異なる交通シナリオから10時間のデータを提供する。車両から歩行者、マイクロモビリティまで、交通参加者の8つの異なるクラスをカバーしている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:03:32 GMT)
Confronting LLMs with Traditional ML: Rethinking the Fairness of Large Language Models in Tabular Classifications [24.0]
大規模言語モデル (LLM) は, 学習データから社会的偏見を継承する傾向にあり, 分類作業における公平性に大きな影響を及ぼすことを示した。この観察は、社会的バイアスがLSM自体に固有のものであり、事前学習されたコーパスから継承されていることを強調している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:29:20 GMT)
Take One Step at a Time to Know Incremental Utility of Demonstration: An Analysis on Reranking for Few-Shot In-Context Learning [23.9]
In-Context Learning (ICL)は大規模言語モデル(LLM)の創発的能力である従来の研究では、ラベルとしてLLMの出力を使用することが、デモを選択するためのトレーニングモデルに有効であることが示されている。本稿では,LLMの出力確率に着目して,異なるユーティリティ関数の解析を行う。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:05:40 GMT)
How COVID-19 has Impacted the Anti-Vaccine Discourse: A Large-Scale Twitter Study Spanning Pre-COVID and Post-COVID Era [23.5]
新型コロナウイルスのパンデミックは、ワクチンに対する感情を理解し緩和することがいかに重要かを示した。本研究は,Twitter上での抗ワクチンポストの大規模調査を通じて,これらの疑問に答えようとするものである。本稿では,ツイートを11種類のアンチヴァックスに分類する2つの新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:18:41 GMT)
SGSH: Stimulate Large Language Models with Skeleton Heuristics for Knowledge Base Question Generation [23.4]
知識ベース質問生成(KBQG)は、KBから抽出された3つの事実の集合から自然言語の質問を生成することを目的としている。事前学習技術の進歩により、大きな言語モデル (LLM) (例: GPT-3.5) は間違いなくより意味的な知識を持っている。 KBQGを向上させるため,SGSH(Skeleton Heuristics による GPT-3.5 のインセンティブを高めるためのシンプルで効果的なフレームワーク)を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:17:36 GMT)
StateFlow: Enhancing LLM Task-Solving through State-Driven Workflows [23.2]
StateFlowは、複雑なタスク解決プロセスをステートマシンとして概念化する、新しいタスク解決パラダイムである。 StateFlowでは、(状態と状態遷移を介して)「プロセス基盤」と(状態内のアクションを通して)「サブタスク解決」を区別します。その結果, StateFlow は LLM の効率を大幅に向上させることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:57:49 GMT)
LLM-Coordination: Evaluating and Analyzing Multi-agent Coordination Abilities in Large Language Models [23.1]
本研究では,Pure Coordination Games の文脈におけるLarge Language Models (LLM) の詳細な解析を目的とした。以上の結果から, GPT-4-turbo を併用した LLM エージェントは, 最先端の強化学習法に匹敵する性能を示した。コーディネーションQAの結果は、LLMのマインド推論と共同計画能力の向上のための大きな空間を示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:35:39 GMT)
MonoBox: Tightness-free Box-supervised Polyp Segmentation using Monotonicity Constraint [23.0]
単調性に制約されたボックス教師付きセグメンテーション手法であるMonoBoxを提案する。 MonoBoxは、ユーザフレンドリーでないボックステトネス仮定からトレーニングを解放する。パブリックシンセサイザーと社内のリアルノイズデータセットの実験は、MonoBoxが他のアンチ・ノイズ・オブ・ザ・アーティファクトを上回っていることを示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:45:38 GMT)
Language-Informed Visual Concept Learning [22.9]
我々は概念エンコーダのセットを訓練し、言語インフォームドの概念軸のセットに関連する情報を符号化する。次に、トレーニング済みのVisual Question Answering(VQA)モデルから得られたテキスト埋め込みの集合に埋め込みの概念を固定する。推論時に、新しいテスト画像から様々な軸に沿った概念埋め込みを抽出し、それをリミックスして視覚概念の新規な構成で画像を生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:14:35 GMT)
On Retrieval Augmentation and the Limitations of Language Model Training [22.9]
トレーニングデータだけで、$k$-nearestの隣人($k$NN)検索による言語モデルの強化は、その難易度を低下させる可能性がある。トレーニングデータに因果関係のない追加情報が含まれている設定において、LM能力を評価するための新しいデータセットを作成する。 k$NN検索をより使いやすくするために,従来の検索に代えてデータストアキーを値にマップする多層パーセプトロンモデルを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:23:23 GMT)
Alpha Invariance: On Inverse Scaling Between Distance and Volume Density in Neural Radiance Fields [22.8]
3次元シーン次元におけるスケールのあいまいさは、ニューラルラディアンス場の密度の大きさのあいまいさをもたらす。 1)ログ空間における距離密度と体積密度のパラメータ化,2)高線透過性を保証するための識別非依存戦略を推奨する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:58:57 GMT)
$\texttt{LM}^\texttt{2}$: A Simple Society of Language Models Solves Complex Reasoning [22.8]
大規模言語モデル(LLMS)は複雑で多段階の推論をしばしば失う。本稿では,これらの課題に対処するためにLM2を提案する。 LM2は分解、解法、検証を3つの異なる言語モデルにモジュール化する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:23:10 GMT)
Disentangled Pre-training for Human-Object Interaction Detection [22.7]
本稿では,DP-HOI検出のための非交互事前学習法を提案する。 DP-HOIは、オブジェクト検出とアクション認識データセットを使用して、検出およびインタラクションデコーダ層を事前トレーニングする。これは、様々な稀なカテゴリにおける既存のHOI検出モデルの性能を大幅に向上させる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:21:16 GMT)
All in an Aggregated Image for In-Image Learning [22.6]
本稿では,In-Image Learning (I$2$L) と呼ばれる新しいコンテキスト内学習(ICL)機構を提案する。 I$2$Lは、実演例、視覚的手がかり、思考の連鎖的推論を集約されたイメージに組み合わせている。本研究では,MathVista 上で I$2$L と I$2$L-Hybrid の有効性を評価するための広範囲な実験を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:32:51 GMT)
Boosting Visual Recognition for Autonomous Driving in Real-world Degradations with Deep Channel Prior [22.3]
霧、低照度、動きのぼかしは画像の品質を低下させ、自動運転の安全性を脅かす。本研究は、劣化した視覚認識のための新しいDeep Channel Prior (DCP)を提案する。これに基づいて、教師なし特徴補正を実現するために、新しいプラグアンドプレイunsupervised Feature Enhancement Module (UFEM)を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:16:56 GMT)
Noise Masking Attacks and Defenses for Pretrained Speech Models [22.2]
音声モデルは、モデルパフォーマンスを改善するために、しばしば機密データに基づいて訓練される。 Amidらによって導入されたノイズマスキング攻撃は,音声の書き起こしを部分的にノイズに置き換えることで自動音声認識(ASR)モデルを攻撃する。我々はこれらの攻撃をASRモデルを超えて拡張し、事前訓練された音声エンコーダを攻撃する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:49:03 GMT)
NeRFCodec: Neural Feature Compression Meets Neural Radiance Fields for Memory-Efficient Scene Representation [22.2]
メモリ効率のよいシーン表現のための非線形変換,量子化,エントロピー符号化を統合したエンドツーエンドのNeRF圧縮フレームワークを提案する。提案手法は既存のNeRF圧縮法より優れており、0.5MBのメモリ予算で高品質な新規ビュー合成を可能にする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:49:00 GMT)
Limitations of Data-Driven Spectral Reconstruction -- Optics-Aware Analysis and Mitigation [22.1]
コスト効率のよいRGBカメラで撮影したRGB画像からスペクトル情報を抽出することを目的とした,データ駆動型スペクトル再構成の最近の取り組み。我々は、現在のデータセットとオーバーフィッティングに関する実用的制限と、RGB画像に符号化された情報の性質に関する基本的な制限の両方を評価する。本稿では,メタデータデータ拡張と光学レンズ収差の組み合わせを利用して,RGB画像へのメタデータ情報の符号化を改善することを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:26:12 GMT)
SegICL: A Universal In-context Learning Framework for Enhanced Segmentation in Medical Imaging [22.0]
In-Context Learning (ICL) を利用した画像セグメンテーション手法であるSegICLを紹介する。 SegICLはテキスト誘導セグメンテーションを採用し、少量のイメージマスクペアでテキスト内学習を行うことができる。私たちのコードはまもなくリリースされるでしょう。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:55:02 GMT)
Configuration Validation with Large Language Models [22.0]
大きな言語モデル(LLM)は、MLベースの構成検証の長期的制限に対処する上で、有望であることを示している。汎用的なLCMベースの構成検証フレームワークCiriを開発した。 Ciriは有効なプロンプトエンジニアリングを採用し、有効な設定データと設定ミスデータの両方に基づいて数ショットの学習を行う。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:02:07 GMT)
Large Language Models as Planning Domain Generators [21.6]
大規模言語モデル(LLM)は、単純なテキスト記述から計画的なドメインモデルを生成するために使用できる。 LLMは、自然言語記述から正しい計画領域を生成するのに適度な習熟度を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:39:23 GMT)
Weakly-supervised Audio Separation via Bi-modal Semantic Similarity [21.6]
既存のmix-and-separateベースのメソッドは、マルチソースのトレーニングミックスで大幅にパフォーマンス低下する。そこで本研究では,既存の教師なしフレームワークを拡張して,単一ソース信号のターゲットモダリティを分離する汎用バイモーダル分離フレームワークを提案する。我々のフレームワークは,ベースライン上でのSDR(Signal-to-Distortion Ratio)で71%向上し,教師付き学習性能の97.5%に達することを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:59:58 GMT)
GLEMOS: Benchmark for Instantaneous Graph Learning Model Selection [21.6]
GLEMOSは、即時グラフ学習(GL)モデル選択のためのベンチマークである。リンク予測やノード分類を含む基本的なGLタスクのベンチマークデータを提供する。新しいモデル、新しいグラフ、新しいパフォーマンスレコードで簡単に拡張できるように設計されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:13:00 GMT)
MuChin: A Chinese Colloquial Description Benchmark for Evaluating Language Models in the Field of Music [21.4]
MuChinは中国語で書かれた最初のオープンソースの音楽記述ベンチマークである。音楽の理解と記述において,マルチモーダル大規模言語モデルの性能を評価するように設計されている。ベンチマークに関連するすべてのデータとスコアリングのコードがオープンソース化された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:15:35 GMT)
Leveraging Contextual Information for Effective Entity Salience Detection [21.3]
クロスエンコーダアーキテクチャを用いた中規模言語モデルの微調整により,機能工学的アプローチよりも優れた性能が得られることを示す。また、命令調整言語モデルのゼロショットプロンプトは、タスクの特異性と複雑さを示す劣った結果をもたらすことを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:53:28 GMT)
Visual Concept Connectome (VCC): Open World Concept Discovery and their Interlayer Connections in Deep Models [21.2]
視覚概念接続(VCC)は、人間の解釈可能な概念とその層間接続を、完全に教師なしの方法で発見する。提案手法は,すべての層にまたがる接続重み付けを同時に実現し,ネットワーク構造のグローバルな解析に有効である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:40:55 GMT)
Online Local False Discovery Rate Control: A Resource Allocation Approach [21.2]
本研究では,各実験が仮説テストタスクに対応する連続的な実験を行うことの問題点を考察する。目的は、局所的偽発見率(FDR)によって測定される全ての時点において、低いエラー率を維持しながら発見数を最大化することである。予算安全バッファを組み込んだ新しいポリシーを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:36:56 GMT)
Traffic State Estimation from Vehicle Trajectories with Anisotropic Gaussian Processes [21.1]
本稿では,標準等方性GPカーネルを異方性カーネルに変換するカーネル回転再パラメータ化方式を提案する。また、複数のレーンの交通状態を同時に推定できるマルチアウトプットGPへのアプローチも拡張しています。連結車両(CV)と人間駆動車両(HV)の混合交通について検討し,交通状態推定(TSE)方式を5%から50%まで実験した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:34:37 GMT)
A Universal Knowledge Embedded Contrastive Learning Framework for Hyperspectral Image Classification [21.0]
ハイパースペクトル画像(HSI)分類技術の研究が盛んに行われ、様々なモデルが開発されている。教師付き・教師なし・半教師付きHSI分類のための共通知識組み込みコントラスト学習フレームワーク(KnowCL)を提案する。我々は,データ変換と拡張技術とともに,新しいHSI処理パイプラインを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:24:21 GMT)
LP++: A Surprisingly Strong Linear Probe for Few-Shot CLIP [20.9]
リニアプローブ(LP)は、数発のCLIP適応の弱いベースラインとしてしばしば報告されている。本研究では,コンベックス最適化の観点から標準LPベースラインの一般化について検討する。我々の画像言語目的関数は、これらの非自明な最適化の洞察や成分とともに、驚くほど、競争力の高いCLIPパフォーマンスをもたらす。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:23:10 GMT)
Semi-Supervised Domain Adaptation for Wildfire Detection [20.9]
本稿では,オブジェクト検出に半教師付きドメイン適応を利用する,山火事検出のための新しいプロトコルを提案する。我々のデータセットは、現在の最大のベンチマークワイルドファイアデータセットHPWRENの30倍の多様性を持つラベル付きシーンを含んでいる。我々のフレームワークは、平均精度の3.8%という顕著なマージンで、ソースのみのベースラインを著しく上回ります。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:03:13 GMT)
YAYI-UIE: A Chat-Enhanced Instruction Tuning Framework for Universal Information Extraction [20.3]
ユニバーサル情報抽出(YAYI-UIE)のためのエンドツーエンドのチャット強化指導フレームワークを提案する。具体的には,対話データと情報抽出データを用いて,情報抽出性能を協調的に向上する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:36:35 GMT)
SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces [20.2]
映像生成のための近年の拡散モデルでは、時間的特徴を抽出するために注意層を主に利用している。我々は、より長いビデオシーケンスを生成するために状態空間モデル(SSM)を活用することを提案する。我々のSSMベースのモデルは、注目ベースのモデルと競合するFVDスコアを維持しながら、長いシーケンスでメモリ消費を大幅に削減することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:38:18 GMT)
SignAvatars: A Large-scale 3D Sign Language Holistic Motion Dataset and Benchmark [20.1]
SignAvatarsは、難聴者や難聴者のコミュニケーションギャップを埋めるために設計された、最初の大規模でマルチプロンプトな3D手話言語(SL)モーションデータセットである。データセットは153のシグナから7万本のビデオで構成され、合計8.34万フレームが分離されたサインと、連続的かつ協調的なサインの両方をカバーしている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:01:56 GMT)
WaveDH: Wavelet Sub-bands Guided ConvNet for Efficient Image Dehazing [20.1]
画像デハージングにおけるこの効率ギャップに対処するために設計された,新規でコンパクトなConvNetであるWaveDHを紹介する。我々のWaveDHはウェーブレットサブバンドを利用して、誘導型アップ・アンド・ダウンサンプリングと周波数認識機能の改良を行う。提案手法であるWaveDHは,計算コストを大幅に削減した画像デハージングベンチマークにおいて,最先端の多くの手法より優れている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:52:05 GMT)
Generalizing 6-DoF Grasp Detection via Domain Prior Knowledge [20.0]
本稿では,6-DoFグリップ検出法の一般化能力に着目した。我々は、ロボットの把握に関するドメイン事前知識を取り入れ、大きな形状と構造の違いを持つ物体への適応性を向上する。 GraspNet-1billionベンチマークで実施された実験は、新しいオブジェクトセットに対してかなりのパフォーマンス向上を示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:33:21 GMT)
Accelerating Transformer Pre-Training with 2:4 Sparsity [19.6]
NVIDIA Ampere GPUは、細粒度の2:4スパース行列乗算を、その密度の高い等価値の2倍の速さで実行することができる。本稿では,2:4の異なるトレーニング手法において,複数のトランスフォーマー上での手法の組み合わせが最高の性能に達することを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:12:42 GMT)
Large Language Models for Orchestrating Bimanual Robots [19.6]
大型言語モデル (LLM) は様々なロボットタスクを制御している。しかし、連続空間におけるコーディネートは双対問題にとって特に困難である。本稿では,Language-based Bimanual Orchestration (LABOR)を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:08:35 GMT)
Pre-trained Vision and Language Transformers Are Few-Shot Incremental Learners [19.6]
FSCIL(Few-Shot Class Incremental Learning)は、クラスごとにいくつかのサンプルしか与えられていないことを忘れずに、新しいクラスを漸進的に学習するモデルを必要とするタスクである。 FSCILは2つの大きな課題に直面している。大規模なデータセットで事前訓練された視覚や言語変換器のような大規模モデルは、数発のインクリメンタル学習者には優れていると我々は主張する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:23:22 GMT)
Learned Kernels for Sparse, Interpretable, and Efficient Medical Time Series Processing [19.5]
医療信号の迅速かつ信頼性が高く正確な解釈は、臨床的意思決定に不可欠である。ディープラーニングモデルは、しばしば計算集約的であり、解釈可能性に欠ける。本稿では,医療時系列処理のための単一層ニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:31:51 GMT)
3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations [19.4]
3次元拡散政策(DP3)は、新しい視覚模倣学習手法である。実験では、DP3は10のデモでほとんどのタスクを処理し、24.2%の相対的な改善でベースラインを超えた。実際のロボット実験では、DP3は頻繁に行う基準法とは対照的に、安全要件にほとんど違反しない。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:59:57 GMT)
Pregnant Questions: The Importance of Pragmatic Awareness in Maternal Health Question Answering [19.2]
本研究では,母親が妊娠と乳幼児ケアについて質問したときの仮定と含意,あるいは実践的推論について検討する。我々は3つの異なるソースから500の質問から2,727の推論データセットを収集します。既存のQAパイプラインを実用的な推論でインフォームすると、より完全な応答が生成されることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:42:21 GMT)
LoSh: Long-Short Text Joint Prediction Network for Referring Video Object Segmentation [18.8]
ビデオオブジェクトセグメンテーション(RVOS)の参照は、所定のテキスト表現によって参照されるターゲットインスタンスをビデオクリップにセグメントすることを目的としている。テキスト表現は通常、インスタンスの外観、動作、および他者との関係に関する洗練された記述を含む。本稿では,元来の長文表現から主語中心の短文表現を取り出すことにより,この問題に対処する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:10:53 GMT)
Proximal Oracles for Optimization and Sampling [18.8]
非滑らかな目的関数による凸最適化と非滑らかなポテンシャルによる対数凹型サンプリングについて検討する。非滑らか性による課題を克服するため、アルゴリズムは最適化とサンプリングに2つの強力な近位フレームワークを用いる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:52:28 GMT)
A (More) Realistic Evaluation Setup for Generalisation of Community Models on Malicious Content Detection [18.8]
本稿では,本手法を用いたモデル一般化のための新しい評価手法を提案する。提案した数ショットのサブグラフを用いて学習したグラフメタラーナは、インダクティブセットアップにおいて標準コミュニティモデルより優れた性能を示すことを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:32:21 GMT)
DPA-Net: Structured 3D Abstraction from Sparse Views via Differentiable Primitive Assembly [18.7]
スパースRGB画像から構造化された3D抽象化を学習するための、微分可能なレンダリングフレームワークを提案する。異なるボリュームレンダリングを活用することで,本手法は3次元監視を必要としない。本手法は,スパースビューからの3次元プリミティブ抽象に対する最先端の代替手段よりも優れた性能を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:09:25 GMT)
Sentence-level Media Bias Analysis with Event Relation Graph [18.4]
メディアバイアスを文レベルで識別し,読者の意見に反する偏見文をピンポイントで特定する。特に、偏見文中の事象は、文書内の他の事象と関連して理解する必要があることを観察する。本稿では,文レベルのバイアス識別のための事象と事象の関係性を明確に推論するために,事象関係グラフを構築することを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:16:03 GMT)
VidEdit: Zero-Shot and Spatially Aware Text-Driven Video Editing [18.2]
ゼロショットテキストベースのビデオ編集のための新しい方法であるVidEditを紹介する。実験の結果,VidEditはDAVISデータセット上で最先端の手法より優れていることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:08:12 GMT)
FedSN: A Novel Federated Learning Framework over LEO Satellite Networks [18.2]
多数の低軌道軌道(LEO)衛星が打ち上げられ、SpaceXなどの商業企業によって宇宙に投入された。 LEO衛星が搭載するマルチモーダルセンサにより、通信だけでなく、空間変調認識やリモートセンシング画像分類など、さまざまな機械学習アプリケーションにも機能する。本稿では,これらの課題に対処するための一般FLフレームワークとしてFedSNを提案し,LEO衛星上でのデータ多様性について検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:53:20 GMT)
GDA: Generalized Diffusion for Robust Test-time Adaptation [18.2]
Generalized Diffusion Adaptation (GDA) は様々なOODタイプに対して堅牢な新しい拡散型テスト時間適応法である。 GDAは拡散誘導適応における先行研究より一貫して優れていることを示す。 ImageNet-Cで4.4%から5.02%、Rendition、Sketch、Stylizedベンチマークで2.5%から7.4%まで、最も高い分類精度の向上を実現している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:08:35 GMT)
Text-to-3D using Gaussian Splatting [18.2]
本稿では,最新の最先端表現であるガウススプラッティングをテキストから3D生成に適用する新しい手法であるGSGENを提案する。 GSGENは、高品質な3Dオブジェクトを生成し、ガウススティングの明示的な性質を活用することで既存の欠点に対処することを目的としている。我々の手法は繊細な細部と正確な形状で3Dアセットを生成することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:10:02 GMT)
Extremum-Seeking Action Selection for Accelerating Policy Optimization [18.2]
連続空間の制御のための強化学習は、典型的にはガウス分布のような高エントロピーポリシーを用いて局所的な探索と性能の最適化を推定する。本稿では,ESC(Extremum-Seeking Control)に基づく適応制御を付加することで,モデルフリーなRL設定におけるアクション選択を改善することを提案する。本手法は, 各種制御学習環境において, 学習効率を向上させるために, 標準方針最適化において容易に追加することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:39:17 GMT)
Unifying Qualitative and Quantitative Safety Verification of DNN-Controlled Systems [18.0]
深部強化学習技術の急速な進歩は、ディープニューラルネットワーク(DNN)を利用した安全クリティカルシステムの監視を可能にする既存の検証アプローチのほとんどは定性的アプローチに依存しており、主に到達可能性分析を利用している。本稿では,定性的・定量的な安全性検証問題を統一するための新しい枠組みを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:31:51 GMT)
Co-Speech Gesture Video Generation via Motion-Decoupled Diffusion Model [18.0]
共同音声ジェスチャーは、人間と機械の相互作用において優れた視覚効果を得ることができる。共同音声ジェスチャビデオを生成するための新しい動き分離フレームワークを提案する。提案手法は,動作評価と映像評価の両方において,既存の手法よりも優れていた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:40:34 GMT)
Tuning for the Unknown: Revisiting Evaluation Strategies for Lifelong RL [18.0]
ディープRLの標準的なプラクティスは、エージェントの全生涯にわたって、デプロイ環境への未使用のアクセスを仮定することである。本稿では, 寿命の長いRL研究の進展が, 不適切な経験的手法によって支えられているという考えを考察する。いずれの手法も1パーセントのチューニングに制限された場合,性能が低下するのに対して,ネットワークの可塑性を維持するために設計されたアルゴリズム的緩和は驚くべき性能を発揮する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:13:22 GMT)
One-dimensional Fermi polaron after a kick: two-sided singularity of the momentum distribution, Bragg reflection and other exact results [17.9]
我々は、ポストキック緩和が終わったときに確立されたポーラロン運動量の分布を計算する。この分布の顕著な特徴は、2つの過程のうちの1つに対応することができる両側のパワーロー特異点である。最初のプロセスでは、全てのインパルスは、流体のフォノンのような励起を発生させることなく、ポーラロンに転送される。第2のプロセスでは、インパルスは流体の中心運動とポラロンの間で共有されるが、流体の励起は生じない。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:51:05 GMT)
Can Humans Identify Domains? [17.6]
テキストドメインは、下流モデルのパフォーマンスに影響を及ぼすため、自然言語処理(NLP)コミュニティにおいて重要な特性である。本研究は,本質的なテクスト特性の同定において,人間の習熟度によるドメインの中核的概念について考察する。 NLPにおけるドメインの多様さにもかかわらず、それらの定義方法に関する人間のコンセンサスはほとんどない。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:49:07 GMT)
CHOSEN: Contrastive Hypothesis Selection for Multi-View Depth Refinement [17.4]
CHOSENは柔軟で堅牢で効果的なマルチビュー深度改善フレームワークである。既存のマルチビューステレオパイプラインでも使用できる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:27:03 GMT)
BRAIxDet: Learning to Detect Malignant Breast Lesion with Incomplete Annotations [17.1]
マンモグラムのスクリーニングから悪性病変を検出する方法は通常、完全な注釈付きデータセットで訓練される。しかし,実世界のマンモグラムデータセットには,グローバルな分類だけで弱い注釈が付けられている部分集合が存在するのが一般的である。本稿では,弱弱教師付き・半教師付き学習問題としてトレーニングを定式化するジレンマの中間的解法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:03:02 GMT)
AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.9]
構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:44:02 GMT)
FRDiff : Feature Reuse for Universal Training-free Acceleration of Diffusion Models [16.9]
拡散モデルに固有の時間的冗長性を活用する高度な加速手法を提案する。時間的類似度の高い特徴マップの再利用は、出力品質を損なうことなく計算資源を節約する新たな機会を開く。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:40:54 GMT)
Multi-Level Label Correction by Distilling Proximate Patterns for Semi-supervised Semantic Segmentation [16.8]
誤ラベルを訂正するアルゴリズムとして,MLLC (Multi-Level Label Correction) を提案する。 MLLCは、教師付きベースラインを大幅に改善し、CityscapesとPASCAL VOC 2012データセット上のさまざまなシナリオにおける最先端のアプローチより優れている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:06:20 GMT)
Toward Informal Language Processing: Knowledge of Slang in Large Language Models [16.4]
我々は,スラングの自動処理に関連するタスクセットの評価を支援するデータセットを構築した。評価と微調整の両面で,2つのコアアプリケーションにおけるデータセットの有効性を示す。 GPT-4のようなLCMはゼロショット設定で優れた性能を発揮するが、我々のデータセットで微調整された小さなBERTのようなモデルは同等の性能を得る。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:50:18 GMT)
Transforming LLMs into Cross-modal and Cross-lingual RetrievalSystems [16.3]
大規模言語モデル(LLM)は、ペア化された音声とテキストデータを持つ言語を超えた、テキストのみのデータに基づいて訓練される。マルチモーダルDEM検索システムの初期化にLLMを使うことを提案する。本システムは,21言語のみを訓練しながら,102言語で音声とテキストをマッチングできる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:42:28 GMT)
Towards Leveraging AutoML for Sustainable Deep Learning: A Multi-Objective HPO Approach on Deep Shift Neural Networks [16.3]
本研究では,資源消費を最小化しつつ,DSNNの性能を最大化するためのハイパーパラメータ最適化(HPO)の影響について検討する。実験の結果,提案手法の有効性が示され,精度が80%以上,計算コストが低いモデルが得られた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:03:37 GMT)
A 65nm 8b-Activation 8b-Weight SRAM-Based Charge-Domain Computing-in-Memory Macro Using A Fully-Parallel Analog Adder Network and A Single-ADC Interface [16.2]
コンピューティング・イン・メモリ(Computer-in-Memory, CiM)は、メモリ内の多重累積演算を可能にする、有望な緩和手法である。この研究は、CIFAR-10データセットで88.6%の精度を示しながら、51.2GOPSのスループットと10.3TOPS/Wエネルギー効率を達成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:58:41 GMT)
Corrupting Convolution-based Unlearnable Datasets with Pixel-based Image Transformations [16.2]
学習不能なデータセットは、トレーニングされたモデルの一般化性能を劇的に低下させる。多くの既存のディフェンス、例えばJPEG圧縮や敵の訓練は、標準制約の付加雑音に基づいてUDを効果的に対抗させる。 Interpolation操作によるランダムな乗算変換を利用して、畳み込み型UDに対する防御を成功させる新しい画像コラプションを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:17:49 GMT)
ImageNot: A contrast with ImageNet preserves model rankings [16.2]
私たちは、ImageNetのスケールに合わせて設計されたデータセットであるImageNotを紹介します。長年にわたってImageNetのために開発された主要なモデルアーキテクチャは、ImageNotでトレーニングされ評価された時に同じランクにランク付けされた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:13:04 GMT)
Adaptive Combinatorial Maximization: Beyond Approximate Greedy Policies [16.1]
我々は、機械学習における中核的な課題である適応性(adaptive)を研究し、アクティブな学習だけでなく、他の多くのドメインにも応用しています。我々は、以前の結果をサブスメイトし、それらを大幅に強化する新しい包括的近似保証を提供する。特に、最大ゲイン比が政策のグリーディ近似因子より大きくないことを示し、それよりもかなり小さくできることを示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:23:54 GMT)
Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models [16.0]
マルチビュー光学錯視(Multi-view optical illusions)は、フリップや回転などの変換によって外観が変化する画像である。既製のテキスト・画像拡散モデルからこれらの錯覚を得るゼロショット法を提案する。本手法の有効性と柔軟性を示す定性的および定量的な結果を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:34:29 GMT)
What Can Transformer Learn with Varying Depth? Case Studies on Sequence Learning Tasks [15.9]
注意層が1つしかない変圧器は記憶に優れるが、他のタスクでは不足する。単一注意層が実行可能な単純な操作のクラスを特定し、これらの単純な操作の組み合わせとして、複雑なタスクがアプローチ可能であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:45:12 GMT)
Predicting the Performance of Foundation Models via Agreement-on-the-Line [15.8]
我々は、異なるデータセットで事前訓練された基礎モデルのアンサンブルが、ライン上での合意を示すことも示している。多様なアンサンブルを慎重に構築することにより,高精度な基礎モデルのOOD性能を予測するために,コンセンサス・オン・ザ・ライン方式を用いることができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:54:38 GMT)
FAIRM: Learning invariant representations for algorithmic fairness and domain generalization with minimax optimality [15.7]
本研究では,多様性型条件下でのフェアネスと領域一般化特性が望ましい学習環境に基づくオラクルFAIRMを提案する。線形モデルでFAIRMを実現するための効率的なアルゴリズムを開発し、最小限の最適化で漸近的性能を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:06:25 GMT)
Enchanting Program Specification Synthesis by Large Language Models using Static Analysis and Program Verification [15.7]
AutoSpecは、自動プログラム検証のための仕様を合成するための自動化アプローチである。仕様の汎用性における既存の作業の欠点を克服し、完全な証明のために十分かつ適切な仕様を合成する。実世界のX509パーサプロジェクトでプログラムを検証するためにうまく適用することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:44:02 GMT)
ADVREPAIR:Provable Repair of Adversarial Attack [15.6]
ディープニューラルネットワーク(DNN)は、ますます安全クリティカルなドメインにデプロイされているが、敵の攻撃に対する脆弱性は深刻な安全リスクを引き起こす。制限されたデータを用いた既存のニューロンレベルの手法は、敵の攻撃機構の複雑さにより、敵の修正に有効性が欠如している。本稿では,限られたデータを用いた敵攻撃の是正可能な修復手法であるADVREPAIRを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:16:59 GMT)
Saliency strikes back: How filtering out high frequencies improves white-box explanations [15.3]
ホワイトボックス」の帰属法は、高周波ノイズによってしばしば汚染される勾配信号に依存している。我々は「FORGrad」と呼ばれる新しいアプローチを導入する。本手法は,各モデルアーキテクチャの固有特性に合わせて最適なカットオフ周波数を用いて,ノイズアーティファクトを効果的にフィルタリングする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:55:51 GMT)
FISTNet: FusIon of STyle-path generative Networks for Facial Style Transfer [15.3]
StyleGAN法は、顔画像にアーティファクトが導入された結果、過度に適合する傾向にある。本稿では,事前学習したマルチパス方式の転送ネットワークを利用する顔画像のためのFusIon of STyles(FIST)ネットワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:46:19 GMT)
Towards Trustworthy Reranking: A Simple yet Effective Abstention Mechanism [15.2]
実世界の制約に合わせた軽量な禁制機構を提案する。ブラックボックスシナリオにおける禁忌戦略を評価するためのプロトコルを導入し,その有効性を実証する。実験複製と禁忌実装のためのオープンソースコードを提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:56:53 GMT)
Open-Vocabulary Federated Learning with Multimodal Prototyping [15.0]
フェデレートラーニング(FL)の文脈における視覚言語モデル(VLM)に適した新しい適応フレームワークを提案する。 Fed-MPは、軽量クライアント残量に基づいて局所モデル重みを適応的に集約し、新しいマルチモーダルプロトタイピング機構に基づいて予測を行う。各種データセットに対する実証実験により,Fed-MPの有効性が検証された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:03:33 GMT)
EMONA: Event-level Moral Opinions in News Articles [14.9]
本稿では,ニュース記事における出来事に対する道徳的意見を理解するための新たなタスクを開始する。我々は新しいデータセット、EMONAを作成し、ニュース記事に注釈付きイベントレベルの道徳的意見を作成しました。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:57:19 GMT)
Reinforcement Learning with Elastic Time Steps [14.8]
ソフト・Elastic Actor-Critic (SEAC) は、この問題に対処するための非政治的アクター批判アルゴリズムである。 SEACは弾性時間ステップ、既知の可変期間の時間ステップを実装しており、エージェントが制御周波数を変更して状況に適応することができる。ニュートン・キネマティクスの迷路ナビゲーションタスクと3Dレーシングゲーム『トラックマニア』におけるSEACのシミュレーション能力を評価する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:02:07 GMT)
Deployable Reinforcement Learning with Variable Control Rate [14.8]
可変制御率を持つ強化学習(RL)の変種を提案する。このアプローチでは、ポリシーは、エージェントが取るべきアクションと、そのアクションに関連する時間ステップの期間を決定する。ニュートンキネマティクスを用いたエージェントを駆動する概念実証シミュレーションによりSEACの有効性を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:18:19 GMT)
Extracting Norms from Contracts Via ChatGPT: Opportunities and Challenges [14.6]
契約書からの規範抽出におけるChatGPTの有効性について検討する。トレーニングや微調整を必要とせずに,ノルム抽出において有望な性能が得られる。しかし、これらのノルムを抽出する際のChatGPTのいくつかの制限は、誤ったノルム抽出につながる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:49:34 GMT)
Atom-Level Optical Chemical Structure Recognition with Limited Supervision [14.5]
本稿では,最先端性能を実現する新しい化学構造認識ツールを提案する。従来の手法とは異なり、本手法は原子レベルの局所化を提供する。我々のモデルは、SMILESの監督のみで原子レベルの実体検出を行い、OCSRを実行する最初のモデルである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:01:21 GMT)
Bi-LORA: A Vision-Language Approach for Synthetic Image Detection [14.4]
生成逆数ネットワーク(GAN)や拡散モデル(DM)のような深層画像合成技術は、非常に現実的な画像を生成する時代に定着してきた。本稿では、視覚言語モデル(VLM)のゼロショット特性と相まって、視覚と言語の間の強力な収束能力から着想を得る。我々は,VLMと低ランク適応(LORA)チューニング技術を組み合わせたBi-LORAと呼ばれる革新的な手法を導入し,未知のモデル生成画像に対する合成画像検出の精度を向上させる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:54:22 GMT)
RefQSR: Reference-based Quantization for Image Super-Resolution Networks [14.4]
単一画像超解像はその低分解能観測から高分解能画像を再構成することを目的としている。深層学習に基づくSISRモデルは計算コストの増大を犠牲にして高い性能を示す。本稿では,複数の代表パッチに高ビット量子化を適用したRefQSRという新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:49:38 GMT)
Multi-BERT: Leveraging Adapters and Prompt Tuning for Low-Resource Multi-Domain Adaptation [14.2]
テキストのボリュームと多様性の急速な拡大は、マルチドメイン設定において重大な課題を生じさせる。従来のアプローチでは、複数のドメインに統一モデルを採用するか、各ドメインに個別モデルを使用するかのいずれかが、しばしば重大な制限を課している。本稿では,複数のドメイン固有パラメータからなる1つのコアモデルからなる新しいアプローチを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:15:48 GMT)
GIDN: A Lightweight Graph Inception Diffusion Network for High-efficient Link Prediction [14.2]
このモデルは、異なる特徴空間におけるグラフ拡散を一般化し、複雑なネットワーク構造に起因する大量の計算を避けるために開始モジュールを使用する。我々は、Open Graph Benchmarkデータセット上でGIDNモデルを評価し、ogbl-collabデータセット上でAGDNよりも11%高いパフォーマンスを達成した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:52:53 GMT)
A Comprehensive Survey on AI-based Methods for Patents [14.1]
この調査は、AIによる特許分析の分野における研究者、実践者、特許事務所のリソースとして機能することを目的としている。私たちの調査では、2017年から2023年の間に26の会場から40以上の論文から、最近のAIツールに関する包括的な要約を公開しています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:44:06 GMT)
Morphable Diffusion: 3D-Consistent Diffusion for Single-image Avatar Creation [14.1]
我々は、制御可能な光リアルな人間のアバターを作成するために、生成拡散モデルの品質と機能を高めることを目的としている。我々は,3次元形態素モデルを最先端の多視点拡散手法に統合することで実現した。提案するフレームワークは, 完全3次元一貫性, アニマタブル, フォトリアリスティックな人間のアバターの作成を可能にする最初の拡散モデルである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:29:09 GMT)
Prompts As Programs: A Structure-Aware Approach to Efficient Compile-Time Prompt Optimization [14.0]
本稿では,メタプロンプトプログラムのコンパイル時最適化のためのフレームワークSAMMOを紹介する。 SAMMOは従来の手法を一般化し,命令チューニングにおける複雑なプロンプト,(2)RAGパイプラインチューニング,(3)プロンプト圧縮の性能を向上させる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:35:54 GMT)
Autonomous Data Selection with Language Models for Mathematical Texts [13.8]
自律的なデータ選択に基礎言語モデルを活用する新しい戦略を導入する。提案手法では,メタプロンプト言語モデルをゼロショット検証器として利用し,高品質な数学的コンテンツを自律的に評価・選択する。本手法は,最先端のベースラインに比べて,トークンの事前学習効率が2倍に向上したことを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:17:30 GMT)
Learning CNN on ViT: A Hybrid Model to Explicitly Class-specific Boundaries for Domain Adaptation [13.8]
ほとんどのドメイン適応(DA)法は、畳み込みニューラルネットワーク(CNN)または視覚変換器(ViT)に基づいている。 ECB(Explicitly Class-specific boundaries)と呼ばれる,ViTとCNNの両方をフル活用するためのハイブリッド手法を設計する。 ECBは独自の強みを組み合わせるために、ViTでCNNを学びます。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:02:32 GMT)
Can LLMs get help from other LLMs without revealing private information? [13.7]
カスケード(Cascade)は、ローカルモデルがユーザのデータをそれ自体でラベル付けできない場合、大規模なリモートモデルをクエリ可能な、一般的なタイプの機械学習システムである。プライバシ保護技術を用いたローカルモデルを用いて,そのようなシステムにカスケードシステムを適用する可能性を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:49:33 GMT)
WcDT: World-centric Diffusion Transformer for Traffic Scene Generation [13.6]
WcDT(World-Centric Diffusion Transformer)は、軌道生成過程を最適化する。 Denoising Probabilistic Models (DDPM) を用いた履歴軌跡データの事前処理と遅延空間への符号化符号化されたトラフィックシーンは、トラジェクトリデコーダによってデコードされ、マルチモーダルな将来のトラジェクトリを生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:28:41 GMT)
Neural Ordinary Differential Equation based Sequential Image Registration for Dynamic Characterization [13.5]
この拡張研究は、このフレームワークがシーケンシャルな生物学的プロセスのキャラクタリゼーションにどのように役立つかを論じる。我々の枠組みは、ボクセルを力学系の粒子とみなし、ニューラル微分方程式の積分による変形場を定義する。心臓運動追跡用と経時的脳MRI画像解析用の2つの臨床データセットについて検討した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:04:45 GMT)
The ground state of electron-doped $t-t'-J$ model on cylinders [13.4]
ドーピングレベルは1/6ドル,1/8ドル,1/12ドルで,電子ドープカップレートの位相図で最も興味深い領域である。幅4, 6系では、反強磁性ネイル状態とストライプ状態の間の固定ドーピングスイッチの基底状態が分かる。この研究で観測された境界条件と大きさに対する基底状態の感度は、$t'$-Hubbardモデルと似ている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:18:24 GMT)
Injecting New Knowledge into Large Language Models via Supervised Fine-Tuning [13.4]
本稿では,Large Language Models(LLMs)における知識注入手法としてのスーパーバイザードファインタニング(SFT)の有効性について検討する。さまざまなデータセット生成戦略 – トークンベースとファクトベースのスケーリング – を比較して,モデルが新たな情報を学ぶためのトレーニングデータを生成します。その結果、ドメイン外知識に関連するQ&Aタスクのパフォーマンスが大幅に向上した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:09:45 GMT)
Deconstructing In-Context Learning: Understanding Prompts via Corruption [13.4]
プロンプト全体を4つのコンポーネント(タスク記述、デモインプット、ラベル、インラインインストラクション)に分解する。分類と生成タスクをカバーする10のデータセットを用いて,1.5Bから70Bのモデルについて検討した。プロンプト内の繰り返しテキストはモデル性能を向上し、より大きなモデルはプロンプトのセマンティクスに敏感であることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:50:55 GMT)
Is Exploration All You Need? Effective Exploration Characteristics for Transfer in Reinforcement Learning [13.3]
我々は、オンライントランスファー学習に肯定的な影響を及ぼす特徴を特定するために、さまざまなトランスファータイプ(またはノベルティ')で11の人気のある探索アルゴリズムをテストする。分析の結果,特定の環境変化に対してのみ伝達性能が向上するのに対し,その特性は幅広い伝達タスクにおける性能と効率の向上と相関していることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:45:01 GMT)
QUSL: Quantum Unsupervised Image Similarity Learning with Enhanced Performance [13.3]
本稿では,新しい量子教師なし類似性学習手法QUSLを提案する。 QUSLは古典的なオラクルとは独立して動作する。臨界量子資源利用の50%を超える削減を達成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:17:09 GMT)
Kiki or Bouba? Sound Symbolism in Vision-and-Language Models [13.3]
音声記号はCLIPやStable Diffusionのような視覚・言語モデルに反映されていることを示す。我々の研究は、音の象徴性を実証し、その性質を計算ツールを用いて理解する新しい方法を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:50:21 GMT)
Hexa: Self-Improving for Knowledge-Grounded Dialogue System [13.3]
本研究では,中間段階の生成性能を改善するための自己改善手法を開発した。特に、適切な自己生成応答の多様性を高めるために、誘導プロンプトと改良された損失関数を備えた新しいブートストラップ方式を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:28:40 GMT)
MIPS at SemEval-2024 Task 3: Multimodal Emotion-Cause Pair Extraction in Conversations with Multimodal Language Models [13.1]
本稿では,SemEval 2024 Task 3 の Subtask 2 に対して,会話におけるマルチモーダル感情の原因分析について提案する。本稿では,テキスト,音声,視覚的モダリティを統合した新しいマルチモーダル感情認識・マルチモーダル感情原因抽出フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:46:24 GMT)
Adaptive Feature Fusion Neural Network for Glaucoma Segmentation on Unseen Fundus Images [13.0]
本研究では,未確認領域における緑内障セグメンテーションのための適応的特徴融合ニューラルネットワーク (AFNN) を提案する。ドメインアダプタは、事前訓練されたモデルが、他の画像ドメインから医療基礎画像ドメインへの迅速な適応を支援する。提案手法は,4つの公共緑内障データセット上の既存のファンドスセグメンテーション法と比較して,競争力のある性能を実現する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:30:12 GMT)
An Exploratory Study of the Relationship between SATD and Other Software Development Activities [13.0]
Self-Admitted Technical Debt (SATD)は、開発者が負債を思い出させるためにコードをドキュメント化する、特定のタイプのTechnical Debtである。これまでの研究では、SATDの様々な側面を探求してきた。本研究ではSATDの削除と追加とバグ修正,新機能の追加,テストなどの活動との関係について検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:45:42 GMT)
METAL: Towards Multilingual Meta-Evaluation [12.9]
本研究では,多言語シナリオにおいて,Large Language Models (LLMs) を評価対象としてエンド・ツー・エンド評価を行うためのフレームワークを提案する。要約作業のための母国語話者判定を含む10言語を対象としたデータセットを作成する。 GPT-3.5-Turbo, GPT-4, PaLM2を用いたLCM評価器の性能の比較を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:14:54 GMT)
Variational Dynamic for Self-Supervised Exploration in Deep Reinforcement Learning [12.8]
本研究では,条件付き変分推論に基づく変動力学モデルを提案し,多モード性および生成性をモデル化する。環境遷移の負の対数類似度の上界を導出し、その上界を探査の本質的な報酬として利用する。提案手法は,最先端の環境モデルに基づく探索手法よりも優れている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:09:15 GMT)
MEGAVERSE: Benchmarking Large Language Models Across Languages, Modalities, Models and Tasks [12.7]
本研究の目的は、同一の多言語データセットで比較することで、SoTA LLMの非英語能力の徹底的な評価を行うことである。私たちのベンチマークは、低リソースのアフリカ言語を含む83の言語をカバーする22のデータセットで構成されています。また、データ汚染に関する研究を行い、複数のモデルが多言語評価ベンチマークで汚染される可能性が示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:18:00 GMT)
EventSleep: Sleep Activity Recognition with Event Cameras [12.6]
イベントカメラは暗黒環境でのアクティビティ認識のための有望な技術である。我々は、医療アプリケーションにおけるイベントカメラの適合性を研究するための新しいデータセットと方法論であるEventSleepを紹介する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:03:23 GMT)
Rumor Detection with a novel graph neural network approach [12.4]
ソーシャルメディア上での噂を検出するために,ユーザ相関と情報伝達の表現を共同で学習する新しい検出モデルを提案する。具体的には、グラフニューラルネットワークを利用して、二部グラフからユーザ相関の表現を学習する。本研究では,ユーザ相関パターンを逆転させるには高いコストが必要であることを示すとともに,ユーザ相関をうわさ検出のために考慮することの重要性を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:52:13 GMT)
Image Captioning in news report scenario [12.4]
有名人の写真に特化された画像キャプションの領域を探求する。この調査は、自動ニュースコンテンツ生成を強化し、よりニュアンスな情報発信を容易にすることを目的としている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:57:00 GMT)
Sparse Semi-DETR: Sparse Learnable Queries for Semi-Supervised Object Detection [12.4]
Sparse Semi-DETRは、トランスフォーマーをベースとした、エンドツーエンドの半教師付きオブジェクト検出ソリューションである。 Sparse Semi-DETR には Query Refinement Module が組み込まれており、オブジェクトクエリの品質を高め、小型で部分的に隠されたオブジェクトの検出能力を著しく改善している。 MS-COCOおよびPascal VOCオブジェクト検出ベンチマークでは、Sparse Semi-DETRは現在の最先端手法よりも大幅に改善されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:22:23 GMT)
PhysORD: A Neuro-Symbolic Approach for Physics-infused Motion Prediction in Off-road Driving [12.4]
自動オフロード運転には運動予測が不可欠である。従来の物理学に基づくアプローチは、力学系と外乱を正確にモデル化することの難しさに直面する。オフロード運転時の動作予測のためのデータ駆動型ニューラルモデルに保存則を統合するニューラルシンボリックアプローチであるPhysORDを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:36:31 GMT)
Endo-4DGS: Endoscopic Monocular Scene Reconstruction with 4D Gaussian Splatting [12.3]
動的シーン再構築は、下流の作業を大幅に強化し、手術結果を改善することができる。 NeRFベースの手法は、最近、シーンを再構築する異常な能力で有名になった。本研究では,リアルタイムな内視鏡的動的再構成手法であるEndo-4DGSを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:17:34 GMT)
Meta Prompting for AI Systems [12.3]
本稿では,言語モデル(LM)とAIシステムを利用した問題解決とデータインタラクションの革新的手法であるMeta Prompting(MP)について包括的な研究を行う。 MPは従来のコンテンツ中心の手法よりも情報の構造と構文を強調している。本稿では,メタプロンプティングの形式的定義を探求し,数発のプロンプトから分離し,さまざまなAIアプリケーションにおけるその効果を裏付ける。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:36:57 GMT)
Semantically-Prompted Language Models Improve Visual Descriptions [12.3]
本稿では,表現力のある視覚記述を生成する新しい手法であるV-GLOSS: Visual Glossesを提案する。 V-GLOSSは視覚的記述を改善し、画像分類データセットのゼロショット設定において強い結果が得られることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:19:22 GMT)
Cumulative Reasoning with Large Language Models [12.3]
累積推論(CR)は、累積的かつ反復的に言語モデルを利用する新しいアプローチである。いくつかの複雑な推論タスクを通してCRの優位性を実証する。 CRはMATHデータセットに新しい最先端技術を設定する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:37:39 GMT)
Release of Pre-Trained Models for the Japanese Language [12.3]
日本語で事前学習した生成前変換器(GPT)、コントラスト言語と画像前学習(CLIP)、安定度、HuBERTによる隠れユニット双方向表現(HuBERT)をリリースする。ユーザーは、日本の文化的価値観と整合し、日本の文化のアイデンティティを保証するAIと自由に対話でき、それによってAIの民主化が促進される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:59:43 GMT)
GaitSTR: Gait Recognition with Sequential Two-stream Refinement [12.3]
歩行認識は、歩行シーケンスに基づいて人物を特定することを目的としており、バイオメトリック・モダリティとして有用である。人の歩行シーケンスを表す場合、シルエットと骨格は2つの主要なモダリティである。シルエットとともに歩行認識のための骨格の2列表現について検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:39:35 GMT)
Large Language Models are Good Prompt Learners for Low-Shot Image Classification [12.1]
本稿では,CLIPテキストエンコーダの適応的なプロンプトを生成するLLaMP,Large Language ModelsをPrompt学習者として提案する。実験により、LLaMPは他の最先端の素早い学習法と比較して、ゼロショットの一般化と少数ショットの画像分類の両方においてより良い性能が得られることが示された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:47:35 GMT)
InfLoRA: Interference-Free Low-Rank Adaptation for Continual Learning [12.0]
連続学習では、複数のタスクを逐次学習する必要がある。本研究では,連続学習のための干渉のない低ランク適応(InfLoRA)と呼ばれる新しいPEFT手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:16:20 GMT)
Supporting Mitosis Detection AI Training with Inter-Observer Eye-Gaze Consistencies [11.9]
本研究では、医師の行動データをAIトレーニングのために収集する費用対効果技術としての視線追跡について検討する。視線データを使用する際の大きな課題の1つは、意味のある情報の抽出を妨げる低信号対雑音比である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:57:35 GMT)
MESEN: Exploit Multimodal Data to Design Unimodal Human Activity Recognition with Few Labels [11.9]
MESENはマルチモーダル・エンパワー・ユニモーダル・センシング・フレームワークである。 Mesenは、ラベルのないマルチモーダルデータを利用して、各モーダルに対して効果的なユニモーダル特徴を抽出する。 Mesenは最先端のベースラインよりも大幅なパフォーマンス向上を実現している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:54:05 GMT)
Laying Anchors: Semantically Priming Numerals in Language Modeling [11.8]
我々は,任意のコーパスにおいて,そのコーパス内の数値の分布に支配されるアンカーを生成することによって,意味的に素数に戦略を導入する。学習した埋め込みの数学的基礎の大幅な改善を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:02:00 GMT)
i-Rebalance: Personalized Vehicle Repositioning for Supply Demand Balance [11.7]
深部強化学習(DRL)を用いた個別車両再配置手法i-Rebalanceを提案する。 i-Re Balanceは、99人のリアルドライバーを含む実地ユーザスタディを通じて、リポジションレコメンデーションを受け入れる際のドライバーの判断を推定する。実世界の軌道データの評価では、i-リバランスはドライバーの受け入れ率を38.07%、ドライバーの総収入を9.97%改善している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:50:00 GMT)
Ukrainian Texts Classification: Exploration of Cross-lingual Knowledge Transfer Approaches [11.5]
典型的なテキスト分類タスクにはウクライナのコーパスが欠如している。手動データキュレーションを回避するために,言語間知識伝達手法について検討する。 3つのテキスト分類タスクに対するアプローチを検証した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:37:09 GMT)
Preventing Model Collapse in Gaussian Process Latent Variable Models [11.5]
リニアVMでデータをモデリングする際の一般的な課題は、カーネルの柔軟性の欠如とプロジェクションノイズの不適切な選択である。本稿では、まず、線形VMのレンズによるモデル崩壊に対する射影分散の影響を理論的に検討する。第2に、スペクトル混合(SM)カーネルと微分可能なランダムフーリエ特徴(RFF)カーネル近似を統合することにより、カーネルの柔軟性の低下によるモデル崩壊の問題に対処する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:58:41 GMT)
Jailbreaking Prompt Attack: A Controllable Adversarial Attack against Diffusion Models [11.2]
本稿では,三つのメリットを享受するブラックボックス攻撃法を紹介する。 i)ディレクティブとセマンティック駆動の両方のアタックを可能にし、理論上、事実上、この巨大なユーザコミュニティに危険をもたらす。 CLIP埋め込み空間における単純なガイダンスの実行とセマンティックな損失と追加のセンシティブな単語リストの併用は、非常にうまく機能することがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:49:35 GMT)
Doubly-Robust Off-Policy Evaluation with Estimated Logging Policy [11.2]
本稿では,マルコフ決定プロセスのための新しい二重ロバスト(DR)オフ・ポリティクス (DRUnknown) を導入し,ログポリシと値関数の双方が未知な状況を想定した。提案した推定器は,まずログポリシを推定し,その評価器の分散を最小化し,ログポリシの効果を考慮し,値関数モデルを推定する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:42:44 GMT)
The Solution for the CVPR 2023 1st foundation model challenge-Track2 [11.1]
簡単な戦略により,歩行者検索と車両検索の2つのサブタスクに分割する。歩行者検索タスクでは、IRRAをベースモデルとし、属性ラベルによる知識のマイニングのために属性分類を特に設計する。最終B板試験では70.9点, 最終B板試験では1位であった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:54:39 GMT)
LLM-ABR: Designing Adaptive Bitrate Algorithms via Large Language Models [11.1]
本稿では,LLM-ABRについて述べる。LLM-ABRは大規模言語モデル(LLM)の生成能力を利用して,適応型アルゴリズム(ABR)を自動設計するシステムである。 LLM-ABRは,ブロードバンド,衛星,4G,5Gなど多様なネットワーク構成で評価される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:43:55 GMT)
Gen4DS: Workshop on Data Storytelling in an Era of Generative AI [11.0]
生成AIの急速な開発は、多くの新しい疑問を引き起こした。生成AIはどのようにデータストーリーの作成を促進するか? ストーリーテリングにAIを導入する際の落とし穴とリスクは何か?
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:11:37 GMT)
Octopus v2: On-device language model for super agent [11.0]
本研究は,GPT-4の性能を精度とレイテンシの両方で上回る20億のパラメータを持つデバイスモデルを実現するための新しい手法を提案する。 Llama-7BをRAGベースの関数呼び出し機構で比較すると,レイテンシを35倍に向上する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:01:32 GMT)
Principles from Clinical Research for NLP Model Generalization [11.0]
一般化可能性の基礎を探求し、それに影響を与える要因について検討する。関係抽出タスクにおけるエンティティ間の距離などの学習がモデルの内部妥当性にどのように影響するかを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:27:12 GMT)
Lewis's Signaling Game as beta-VAE For Natural Word Lengths and Segments [11.0]
創発的コミュニケーション(EC)の主な目標は、統計特性を自然言語と共有する言語を創出することである。先行する選択がそれらの統計特性に影響を及ぼすことを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:53:07 GMT)
The Unreasonable Effectiveness of Random Target Embeddings for Continuous-Output Neural Machine Translation [10.9]
連続出力ニューラルマシン翻訳(CoNMT)は、離散的な次ワード予測問題を埋め込み予測に置き換える。完全ランダムな出力埋め込みは、特に大きなデータセットにおいて、厳しい事前訓練されたものよりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:56:46 GMT)
Semi-Structured Chain-of-Thought: Integrating Multiple Sources of Knowledge for Improved Language Model Reasoning [10.8]
本稿では,テキスト文書からの非構造化知識と知識グラフからの構造化知識とをシームレスに統合する,新しい半構造化プロンプト手法を提案する。オープンドメイン型マルチホップ質問応答データセットの実験結果から,提案手法が既存の手法を大幅に上回ることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:36:32 GMT)
Diverse Representation Embedding for Lifelong Person Re-Identification [10.8]
Lifelong Person Re-Identification (LReID)は、連続したデータストリームから継続的に学習し、複数のカメラで個人をマッチングすることを目的としている。 CNNのバックボーンに基づく既存のメソッドは、異なる視点から各インスタンスの表現を調べるには不十分である。本稿では、まずLReIDのための純粋なトランスフォーマーを探索するDRE(Diverse Representations Embedding)フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:31:41 GMT)
SnAG: Scalable and Accurate Video Grounding [10.6]
ビデオにおけるテキスト記述の時間的基盤は、視覚言語学習とビデオ理解において中心的な問題である。ビデオグラウンドモデルのスケーラビリティに及ぼすクロスモーダル融合の影響について検討する。我々は、スケーラブルで正確なビデオグラウンドのためのシンプルなベースラインであるSnAGを提示する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:25:04 GMT)
Emergent Abilities in Reduced-Scale Generative Language Models [10.5]
大規模言語モデルはタスク固有の微調整なしで新しいタスクを解くことができる。この能力は創発的能力と見なされ、数十億のパラメータを持つ大きな言語モデルで主に見られる。本研究では,そのような創発特性がモデルサイズと厳密に結びついているか,縮小スケールで訓練されたより小さなモデルで示すことができるかを検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:00:28 GMT)
Innovations in Neural Data-to-text Generation: A Survey [10.2]
このサーベイは、アプローチ、ベンチマークデータセット、評価プロトコルの構造化された検証によって、ニューラルDTGパラダイムの総合的なビューを提供する。我々は,言語的に有能なシステムの設計だけでなく,公平性と説明責任を示すシステムにも焦点をあてる,DTG研究の有望な道のりを強調した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:33:27 GMT)
SCANNER: Knowledge-Enhanced Approach for Robust Multi-modal Named Entity Recognition of Unseen Entities [10.2]
3つのNER変種を効果的に扱えるモデルであるSCANNERを提案する。 SCANNERは2段階構造であり、最初の段階でエンティティ候補を抽出し、知識を得るためにクエリとして使用する。 NERデータセットのノイズの多いアノテーションから生じる課題に対処するために,新しい自己蒸留法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:05:41 GMT)
Exploring LLMs as a Source of Targeted Synthetic Textual Data to Minimize High Confidence Misclassifications [10.0]
本研究では,データ拡張のための大規模言語モデル (LLM) の利用を,分類タスク中に高い信頼度で誤った予測を行うNLPモデルの問題に対する潜在的な解決策として検討する。緩和のために、人間またはLLMは、高い信頼性の誤分類の自然言語特性を提供し、合成データを生成し、トレーニングセットを拡張するのに使用される。本研究では,3つの分類課題に対するアプローチを広範囲に評価し,信頼性の高い誤分類の数を減らし,その効果を実証する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:25:57 GMT)
Discovering Effective Policies for Land-Use Planning with Neuroevolution [9.9]
森林、都市部、農業など、異なる用途の土地がどのように配分されているかは、地球上の炭素収支に大きな影響を及ぼす。意思決定者が利用できるさまざまな選択肢を効率的に評価できるようにする代理モデルを学ぶことができる。進化的探索プロセスは、特定の場所に対する効果的な土地利用政策を発見するために使用できる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:35:02 GMT)
A Survey on Large Language Model-Based Game Agents [9.9]
ゲームエージェントの開発は、人工知能(AGI)に進む上で重要な役割を担っている本稿では, LLMをベースとしたゲームエージェントについて, 総合的な視点から概観する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:34:18 GMT)
Fashion Style Editing with Generative Human Prior [9.9]
本研究の目的は,テキスト記述を用いた人間のイメージのファッションスタイルの操作である。具体的には、生成した人間の先行性を活用し、学習した潜在空間をナビゲートすることでファッションスタイルの編集を実現する。我々のフレームワークは、抽象的なファッション概念を人間のイメージにプロジェクションし、この分野にエキサイティングな新しいアプリケーションを導入することに成功している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:22:04 GMT)
Octopus: On-device language model for function calling of software APIs [9.8]
大きな言語モデル(LLM)は、高度なテキスト処理と生成能力のために重要な役割を果たす。本研究は,ソフトウェアAPIの起動において,デバイス上でのLCMを活用するための新たな戦略を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:29:28 GMT)
CMRNext: Camera to LiDAR Matching in the Wild for Localization and Extrinsic Calibration [9.7]
CMRNextはカメラ-LIDARマッチングの新しいアプローチであり、センサー固有のパラメータとは独立しており、一般化可能であり、野生で使用することができる。 3つの公開データセットと3つの社内ロボットを含む6つの異なるロボットプラットフォーム上でCMRNextを広範囲に評価した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:42:42 GMT)
DCR: Divide-and-Conquer Reasoning for Multi-choice Question Answering with LLMs [9.6]
大規模言語モデル(LLM)の推論能力を高めるため,DCR(Divide and Conquer Reasoning)を提案する。まず、信頼性スコア(mathcalCS$)に基づいて質問を2つのサブセットに分類する。特に,質問を信頼性スコア(mathcalCS$)に基づいて2つのサブセットに分類する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:58:38 GMT)
PEGASUS: Personalized Generative 3D Avatars with Composable Attributes [9.5]
本稿では,モノクロ映像からパーソナライズされた3次元顔アバターを構築する方法を提案する。提案手法は,合成データベース生成とパーソナライズされた生成アバターの構築の2段階からなる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:27:45 GMT)
Samba: Semantic Segmentation of Remotely Sensed Images with State Space Model [9.4]
本研究では,Sambaという高解像度リモートセンシング画像のためのセマンティックセマンティックセマンティック・セマンティック・フレームワークを提案する。 Sambaはエンコーダ-デコーダアーキテクチャを使用し、Sambaブロックは効率的なマルチレベルセマンティック情報抽出のためのエンコーダとして機能する。 SambaはLoveDAデータセットで非並列のパフォーマンスを達成した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:38:16 GMT)
Corpus Considerations for Annotator Modeling and Scaling [9.3]
一般的に使われているユーザトークンモデルは、より複雑なモデルよりも一貫して優れています。以上の結果から,コーパス統計とアノテータモデリング性能の関係が明らかになった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:27:24 GMT)
Bridging the Projection Gap: Overcoming Projection Bias Through Parameterized Distance Learning [9.3]
Generalized Zero-shot Learning (GZSL) は、見知らぬクラスと見えないクラスの両方からのサンプルを、学習用のクラスサンプルのみを使用して認識することを目的としている。 GZSL法は、投射関数が観測クラスから学習されるため、推論中に観測クラスに偏りが生じる傾向にある。我々はこの予測バイアスに,ロバスト推論のためのパラメータ化されたマハラノビス距離測定値の学習を提案して対処する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:20:01 GMT)
Surface Reconstruction from Gaussian Splatting via Novel Stereo Views [9.2]
本稿では,ガウススプラッティングモデルを用いた表面再構成手法を提案する。我々は3DGSの優れたノベルビュー合成機能を活用している。結果として得られた復元はより正確で、他の方法と比較して細部が細かい。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:13:18 GMT)
Enhancing Functional Safety in Automotive AMS Circuits through Unsupervised Machine Learning [9.1]
AMS回路における早期異常検出のための教師なし機械学習に基づく新しいフレームワークを提案する。提案手法では、様々な回路位置や個々のコンポーネントに異常を注入して、多種多様な総合的な異常データセットを作成する。これらの異常条件下でのシステムの挙動をモニタリングすることにより、異常の伝播とその影響を異なる抽象レベルで捉える。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:33:03 GMT)
Learning Temporal Cues by Predicting Objects Move for Multi-camera 3D Object Detection [9.1]
本稿では,2分岐ネットワークからなるDAP (Detection After Prediction) モデルを提案する。分岐(i)から現在のオブジェクトを予測する特徴は、予測知識を伝達するために分岐(ii)に融合される。私たちのモデルはプラグイン・アンド・プレイで使用することができ、一貫したパフォーマンス向上を示します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:20:47 GMT)
Learning Intersections of Halfspaces with Distribution Shift: Improved Algorithms and SQ Lower Bounds [9.0]
Klivans、Stavropoulos、Vasilyanは、分散シフトを伴うテスト可能な学習の研究を始めた。それらのモデルは、$mathcalD'$に仮定されないという点で、以前のすべての作業から逸脱している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:34:39 GMT)
MR-Scout: Automated Synthesis of Metamorphic Relations from Existing Test Cases [9.0]
オープンソースソフトウェアプロジェクトのテストケースからMRを自動的に合成するMR-Scoutを提案する。符号化されたMRの97%以上は、自動テストケース生成に高品質である。我々の質的研究は、コード化されたMRの55.76%から76.92%が開発者にとって容易に理解可能であることを示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:20:03 GMT)
DSGNN: A Dual-View Supergrid-Aware Graph Neural Network for Regional Air Quality Estimation [9.0]
既存の大気質推定手法では, 研究領域を不整合格子領域に分割する。本稿では,地域空気質評価のためのDual-view Supergrid-aware Graph Neural Network (DSGNN)を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:16:57 GMT)
Active Exploration in Bayesian Model-based Reinforcement Learning for Robot Manipulation [8.9]
ロボットアームのエンドタスクに対するモデルベース強化学習(RL)アプローチを提案する。我々はベイズニューラルネットワークモデルを用いて、探索中に動的モデルに符号化された信念と情報の両方を確率論的に表現する。実験により,ベイズモデルに基づくRL手法の利点が示された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:44:37 GMT)
3D Reconstruction of Interacting Multi-Person in Clothing from a Single Image [8.9]
本稿では,1つの画像からグローバルなコヒーレントなシーン空間上の衣服の多人数インタラクションの形状を再構築する,新しいパイプラインを提案する。この課題を克服するために、人間の2つの先駆体を完全な3次元形状と表面接触に活用する。その結果,本手法は既存の手法と比較して完全で,グローバルに一貫性があり,物理的に妥当であることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:00:30 GMT)
Haina Storage: A Decentralized Secure Storage Framework Based on Improved Blockchain Structure [8.9]
ブロックチェーンに基づく分散ストレージは、クラウドサービス上のセキュアなデータストレージを効果的に実現することができる。しかし、ストレージ容量の低下や効率の低下など、既存のスキームにはまだいくつかの問題がある。主に4つの側面を含む分散ストレージフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:56:27 GMT)
Efficient Online Unlearning via Hessian-Free Recollection of Individual Data Statistics [8.9]
機械学習は、特定のデータを選択的に忘れることを可能にして、データ所有者の権利を忘れないように努力する。近年の手法では,2次情報を含む統計データを事前計算し,保存する手法が提案されている。ほぼ瞬時に学習できるヘッセン自由オンラインアンラーニング手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:54:18 GMT)
LPSNet: End-to-End Human Pose and Shape Estimation with Lensless Imaging [8.8]
レンズレス計測から3次元人のポーズや形状を復元する最初のエンドツーエンドフレームワークを提案する。具体的には、レンズレス計測を復号化するためのマルチスケールレンズレス特徴デコーダを設計する。また,人間の手足端推定精度を向上させるために,両頭補助補助機構を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:33:31 GMT)
Mixture-of-Depths: Dynamically allocating compute in transformer-based language models [8.8]
トランスフォーマーベースの言語モデルは、FLOPを入力シーケンスに均一に展開した。変換器はシーケンス内の特定の位置にFLOPを動的に割り当てることが可能であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:28:11 GMT)
Virtual Sensor for Real-Time Bearing Load Prediction Using Heterogeneous Temporal Graph Neural Networks [8.7]
精密軸受負荷モニタリングは診断・健康管理(PHM)に不可欠であるベアリングセンサーは通常、ベアリングハウジング上に置かれるが、直接負荷監視にはベアリング内部のセンサーが必要である。最近導入されたセンサローラは、直接軸受負荷監視を可能にするが、バッテリ寿命に制約がある。データ駆動の仮想センサーは、バッテリー寿命中に収集されたセンサーローラーデータから学習し、動作条件を負荷にマッピングする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:03:17 GMT)
Bayesian Floor Field: Transferring people flow predictions across environments [8.7]
本研究では,環境学の知識と人間の軌跡からの観察を組み合わせ,動的に学習する新しい手法を提案する。歩行者の観察を必要とせずに初期移行モデルを構築するために、被占領者に基づくディープ・フォワードが使用される。我々は,本モデルがデータ効率を向上し,実大規模環境にまたがる一般化を実現する能力を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:49:07 GMT)
Dissecting Paraphrases: The Impact of Prompt Syntax and supplementary Information on Knowledge Retrieval from Pretrained Language Models [8.6]
ConPARE-LAMAは、3400万の異なるプロンプトからなるプローブで、最小限のパラフレーズ間での比較を容易にする。 ConPARE-LAMAは, PLMの知識検索性能に対する統語的形態や意味情報の独立的な影響についての洞察を可能にする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:35:08 GMT)
Social, Legal, Ethical, Empathetic, and Cultural Rules: Compilation and Reasoning (Extended Version) [8.4]
SLEEC(社会的、法的、倫理的、共感的、文化的)ルールは、AIベースの自律システムが従うべき規則の定式化、検証、実施を促進することを目的としている。 AIシステムで効果的な使用を可能にするためには、これらのルールを自動推論をサポートする形式言語に体系的に翻訳する必要がある。本研究ではまず,SLEEC規則の古典論理への翻訳を正当化するSLEEC規則パターンの言語学的解析を行う。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:09:15 GMT)
Learning to Control Camera Exposure via Reinforcement Learning [8.4]
微調整されたカメラの露出は、しばしば重大な故障と性能劣化を引き起こす。従来のカメラ露光制御法では、複数の収束ステップと時間を要する。リアルタイム処理中にカメラ露出を迅速に制御する新しいカメラ露出制御フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:53:39 GMT)
An Abundance of Katherines: The Game Theory of Baby Naming [8.3]
乳児命名の競争力が高い分野について検討する。私たちは、トラクタブルでクリーンなだけでなく、現実世界を完璧に捉えたモデルを作成します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:45:41 GMT)
Defense without Forgetting: Continual Adversarial Defense with Anisotropic & Isotropic Pseudo Replay [8.3]
敵の防御技術は攻撃に対する堅牢性を維持するために一発設定に焦点を当てることが多い。現実のデプロイメントシナリオでは,新たな攻撃がシーケンスで発生します。我々は、Anisotropic & Isotropic Replay (AIR) と呼ばれる生涯防衛ベースラインを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:41:51 GMT)
Text2HOI: Text-guided 3D Motion Generation for Hand-Object Interaction [8.3]
本稿では,3Dにおける手-物間相互作用のシーケンスを生成するための最初のテキスト誘導作業について紹介する。接触生成のために、VAEベースのネットワークはテキストとオブジェクトメッシュを入力として、手の表面とオブジェクトとの間の接触の確率を生成する。運動生成のために、トランスフォーマーベースの拡散モデルは、この3Dコンタクトマップを、物理的に可塑性な手オブジェクトの動きを生成するための強力な先行手段として利用する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:08:55 GMT)
A Closer Look at Spatial-Slice Features Learning for COVID-19 Detection [8.2]
我々は,CTスキャンに特化して設計されたSpatial-Slice Feature Learning (SSFL++) フレームワークを提案する。本研究の目的は,全CTスキャンでOODデータをフィルタリングし,70%の冗長性を完全に低減し,解析のための重要な空間スライスを選択することである。実験では、トレーニングデータの1%しか持たない単純なE2D(EfficientNet-2D)モデルを用いて、我々のモデルの有望な性能を実証した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:19:27 GMT)
mChartQA: A universal benchmark for multimodal Chart Question Answer based on Vision-Language Alignment and Reasoning [8.1]
本稿では,新しいマルチモーダルチャート質問応答モデルを提案する。我々のモデルは、既存の手法の制約を克服し、視覚的および言語的処理を統合する。このアプローチは、複数のパブリックデータセット上での優れたパフォーマンスを示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:28:44 GMT)
Towards Scalable & Efficient Interaction-Aware Planning in Autonomous Vehicles using Knowledge Distillation [8.1]
本研究では,ディープラーニングと制約付き最適化を組み合わせた原理的かつ効率的な手法を提案する。これらの改良されたネットワークは、より大きなモデルの問題解決効果を維持しつつ、最適化を著しく加速することを示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:04:06 GMT)
Uncertainty-aware Active Learning of NeRF-based Object Models for Robot Manipulators using Visual and Re-orientation Actions [8.1]
本稿では,ロボットが対象物の完全な3次元モデルを高速に学習し,不慣れな方向で操作できるアプローチを提案する。我々は、部分的に構築されたNeRFモデルのアンサンブルを用いて、モデルの不確実性を定量化し、次の動作を決定する。提案手法は, 部分的NeRFモデルにより対象物をいつ, どのように把握し, 再指向するかを判断し, 相互作用中に導入された不整合を補正するために, 対象のポーズを再推定する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:15:06 GMT)
Procedural Fairness in Machine Learning [8.0]
まず、MLモデルの手続き的公正性を定義し、その後、個人的およびグループ的手続き的公正性の形式的定義を与える。本稿では,GPF_FAE$と呼ばれるMLモデルの群手続き的公正性を評価するための新しい指標を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:05:02 GMT)
Settling Time vs. Accuracy Tradeoffs for Clustering Big Data [7.9]
大規模データセット上でのk-meansおよびk-medianクラスタリングの理論的および実用的な実行限界について検討する。私たちのコードは公開されており、実験を再現するためのスクリプトがあります。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:31:19 GMT)
DRCT: Saving Image Super-resolution away from Information Bottleneck [7.8]
ビジョントランスフォーマーベースの低レベル視覚タスクへの応用は、広く成功している。 Dense-Residual-Connected Transformer (DRCT) は空間情報の損失を軽減する。実験結果から,本手法が顕著な効率性を実現することが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:15:36 GMT)
PokeLLMon: A Human-Parity Agent for Pokemon Battles with Large Language Models [7.7]
戦術格闘ゲームにおいて,人間の対人性能を実現する最初のLDM型エージェントであるPokeLLMonを紹介する。オンライン対人戦は、PokeLLMonの人間的な戦闘戦略とジャスト・イン・タイムの意思決定を実証している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:46:35 GMT)
Team UTSA-NLP at SemEval 2024 Task 5: Prompt Ensembling for Argument Reasoning in Civil Procedures with GPT4 [7.6]
本稿では,民事訴訟における民事訴訟処理課題であるSemEval Task 5について紹介する。本システムでは,GPT4を用いて法的議論を推理するプロンプトベースソリューションを提案する。システム全体としては、検証データセットの.8095のマクロF1と、最終テストセットの.7315(21チーム中5番目)が生成される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:55:05 GMT)
Integrated quantum communication network and vibration sensing in optical fibers [7.5]
本稿では、ダウンストリーム量子アクセスネットワーク(DQAN)と光ファイバーの振動検出を統合したネットワークアーキテクチャを提案し、実証する。私たちの統合アーキテクチャは、セキュアな量子通信センサネットワークを構築するための、実用的で費用対効果の高いソリューションを提供します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:35:20 GMT)
UniBEV: Multi-modal 3D Object Detection with Uniform BEV Encoders for Robustness against Missing Sensor Modalities [7.5]
本稿では、欠落したモダリティに対して堅牢性を実現するために、エンドツーエンドのマルチモーダル3Dオブジェクト検出フレームワークを提案する。 UniBEVはLiDARとカメラ入力に加えて、LiDARのみまたはカメラのみの入力でも再トレーニングなしで動作可能である。 UniBEVと最先端のBEVFusionとMetaBEVを、すべてのセンサー入力の組み合わせでnuScenesで比較する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:57:12 GMT)
A Novel Benchmark for Few-Shot Semantic Segmentation in the Era of Foundation Models [7.4]
DINO V2は、様々なデータセットや適応手法において、他のモデルよりも大きなマージンで優れていることを示す。一方、適応法は得られた結果にほとんど相違がなく、単純な線形プローブはより高度でより計算集約的な代替手段と競合する可能性があることを示唆している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:13:03 GMT)
One-Shot Structure-Aware Stylized Image Synthesis [7.4]
OSASISは構造保存に堅牢な新しい一発スタイリング手法である。我々は、OSASISが画像の構造から意味を効果的に切り離し、与えられた入力に実装されたコンテンツやスタイルのレベルを制御することができることを示す。以上の結果から,OSASISは他のスタイリング手法,特にトレーニング中にほとんど遭遇しなかった入力画像よりも優れていた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:18:07 GMT)
Artificial Neural Networks-based Real-time Classification of ENG Signals for Implanted Nerve Interfaces [7.3]
そこで我々は,ラットの坐骨神経で測定された脳波(ENG)信号から感覚刺激を抽出するために,4種類の人工ニューラルネットワーク(ANN)を探索した。データセットの異なるサイズは、リアルタイム分類のための調査されたANNの実現可能性を分析するために考慮される。以上の結果から,ANNはリアルタイムアプリケーションに適しており,100ドル,200ドル以上の信号ウィンドウに対して90%以上のアキュラシーを達成でき,その処理時間も低く,病的回復に有効であることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:26:43 GMT)
CATGNN: Cost-Efficient and Scalable Distributed Training for Graph Neural Networks [7.3]
既存の分散システムは、グラフパーティショニングのためにメモリ内のグラフ全体をロードします。低コストでスケーラブルな分散GNNトレーニングシステムであるCATGNNを提案する。また、分散GNNトレーニングのためのSPRingという新しいストリーミング分割アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:55:39 GMT)
MCAD: Multi-teacher Cross-modal Alignment Distillation for efficient image-text retrieval [7.2]
本稿では,MCAD(Multi-Teacher Cross-modality Alignment Distillation)手法を提案する。 Snapdragon/Dimensityチップ上での軽量CLIPモデルを実装し,動作メモリが$sim$100M,検索遅延が$sim$8.0msである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:12:21 GMT)
AI-generated text boundary detection with RoFT [7.2]
テキストの書き起こし部分と機械生成部分の境界を検出する方法について検討する。特に,境界検出に対するパープレキシティに基づくアプローチは,RoBERTaモデルの教師付き微調整よりも,ドメイン固有データの特異性に頑健であることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:28:04 GMT)
Attribution Regularization for Multimodal Paradigms [7.1]
マルチモーダル機械学習は、学習と意思決定プロセスを強化するために、複数のモーダルからの情報を統合することができる。ユニモーダルモデルは、よりリッチな情報にアクセスできるにもかかわらず、マルチモーダルモデルより優れていることがよく見られる。本研究は,マルチモーダルモデルの意思決定において,すべてのモーダルからの情報を効果的に活用するための新たな正規化用語を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:05:56 GMT)
Interpretable Dimensionality Reduction by Feature Preserving Manifold Approximation and Projection [7.0]
achievementMAPは、それらを低次元の埋め込み空間に埋め込むことで、ソースの特徴を保存する。我々は、桁分類、オブジェクト検出、MNIST対逆例の解釈にdeadMAPを適用した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:33:42 GMT)
Fast and Adaptive Questionnaires for Voting Advice Applications [6.9]
本研究は, ユーザの過去の回答に基づいて, その後の質問を選択する適応型アンケート手法を提案する。 2019年のスイス連邦選挙のSmartvoteデータセットを使って、私たちのアプローチを検証しました。提案手法は,エンコーダとデコーダの両方にIモデルを併用し,質問選択のためのPosteriorRMSE法と組み合わせることで,提案手法の精度を著しく向上させることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:55:50 GMT)
A Tutorial on Gaussian Process Learning-based Model Predictive Control [6.9]
本チュートリアルでは,ガウス過程(GP)とモデル予測制御(MPC)を統合し,複雑なシステムにおける制御の強化を図る。このチュートリアルの中心的な貢献は、文学におけるGP-MPCの詳細な体系的な数学的定式化である。挑戦的な地形における移動ロボットの経路追従や混合車両小隊などのロボット制御の実践的応用について論じる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:13:05 GMT)
TSCM: A Teacher-Student Model for Vision Place Recognition Using Cross-Metric Knowledge Distillation [6.9]
視覚的位置認識は、移動ロボットの自律的な探索とナビゲーションにおいて重要な役割を果たす。既存の手法では、強力だが大規模なネットワークを利用することでこれを克服している。本稿では,TSCMと呼ばれる高性能な教師と軽量な学生蒸留フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:29:41 GMT)
PosterLlama: Bridging Design Ability of Langauge Model to Contents-Aware Layout Generation [6.9]
PosterLlamaは、視覚的およびテキスト的に一貫性のあるレイアウトを生成するように設計されたネットワークである。評価の結果,PosterLlamaは,信頼性とコンテンツ対応レイアウトの生成において,既存の手法よりも優れていることがわかった。これは、非条件のレイアウト生成、要素条件のレイアウト生成、レイアウトの完了など、非常に汎用性の高いユーザー操作ツールとして機能するなど、非パラレルな範囲の条件をサポートする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:16:55 GMT)
Learning The Likelihood Test With One-Class Classifiers [6.9]
2つの代替確率密度関数 (pdfs) P0 と P1 からランダムに生成される観測を考えると、pdf がどの観測を発生させたかを決定する問題を考える。 P0 pdfが知られているとき、我々は可能性テスト(LT)を使い、その分布を持つサンプルのセットが利用可能であれば、一級分類(OCC)を利用する。マルチ層パーセプトロンニューラルネットワーク(NN)と1クラス最小二乗サポートマシン(OSVM)モデルでこれが起こることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:37:59 GMT)
Advancing the Search Frontier with AI Agents [6.8]
複雑な検索タスクは、初歩的な事実発見や再定義のサポート以上のものを必要とする。近年の人工人工知能(AI)の出現は、検索者にさらなる支援を提供する可能性がある。この記事では、これらの問題とAIエージェントが検索システムの能力のフロンティアをいかに前進させているかを考察する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:22:27 GMT)
Tensorized NeuroEvolution of Augmenting Topologies for GPU Acceleration [6.8]
神経進化(NeuroEvolution of Augmenting Topologies、NEAT)アルゴリズムは、神経進化の分野でかなりの認知を得ている。本稿では、NEATアルゴリズムのテンソル化手法を導入し、その多様なネットワークトポロジの変換を可能にする。 NEATライブラリは、Gym, Brax, gymnaxなど、さまざまなベンチマーク環境をサポートしている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:20:12 GMT)
Diffusion$^2$: Dynamic 3D Content Generation via Score Composition of Orthogonal Diffusion Models [6.7]
動的3Dコンテンツ作成のための新しいフレームワークであるDiffusion$2を提示する。私たちのフレームワークは数分で4Dコンテンツを生成できます。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:58:03 GMT)
Red-Teaming Segment Anything Model [6.7]
Segment Anything Modelは、コンピュータビジョンのセグメンテーションタスクのための、最もよく知られた基礎モデルの一つである。この研究は、Segment Anything Modelを困難なタスクに対してテストする、多面的な赤チーム分析を提示します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:07:50 GMT)
Optimal probe states for single-mode quantum target detection in arbitrary object reflectivity [6.6]
最適化アルゴリズムを用いて、任意のオブジェクト反射率に対する単一モード連続変数OPSを同定する。以上の結果から,OPSは特定の条件下では例外なく,ほとんどの反射率シナリオにおいて非ガウス状態であることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:38:15 GMT)
Semantic Augmentation in Images using Language [6.6]
本稿では,既存のデータセットを拡張するために生成された画像を利用する手法を提案する。本稿では,深層学習モデルの領域外一般化能力を改善するために,効果的なデータ拡張のための様々な戦略について検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:54:24 GMT)
SPMamba: State-space model is all you need in speech separation [6.6]
状態空間モデルを用いた音声分離のためのネットワークアーキテクチャを提案する。我々はTF-GridNetモデルを基本フレームワークとして採用し、Transformerコンポーネントを双方向のMambaモジュールで置き換える。実験の結果,マンバモデルの性能面において重要な役割を担っていることが明らかとなった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:04:31 GMT)
FusionINN: Invertible Image Fusion for Brain Tumor Monitoring [6.5]
FusionINNは、融合した画像を効率よく生成し、ソース画像に分解することができる、新しい非可逆画像融合フレームワークである。我々は、医療用画像融合のような生命に敏感な用途に欠かせない、融合した画像の分解可能性について、初めて調査する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:16:46 GMT)
CAM-Based Methods Can See through Walls [6.4]
CAMに基づくほとんどの解釈可能性法は、重要なスコアを、モデルが見ることができない画像の一部に誤って属性付けることができることを示す。我々は、画像の下部を使わないよう制約されたVGGライクなモデルを訓練し、画像の見えない部分の正のスコアを観察する。この挙動は、2つの新しいデータセットで定量的に評価される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:57:30 GMT)
Pretrain, Prompt, and Transfer: Evolving Digital Twins for Time-to-Event Analysis in Cyber-physical Systems [6.2]
デジタル双極子(DT)は、CPSの開発、保守、安全かつ安全な運用を支援する効率的な方法として機能することが広く受け入れられている。しかし、CPSは、新しい機能や更新機能によって頻繁に進化し、対応するDTをCPSと同期させるように要求する。 DTの進化に不確実性を考慮したトランスファー学習を応用した PPT という新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:24:30 GMT)
Insights from the Use of Previously Unseen Neural Architecture Search Datasets [6.2]
我々は、一連のNASチャレンジのために作成された8つの新しいデータセットを示す:AddNIST、Language、MultNIST、CIFARTile、Gutenberg、Isabella、GeoClassing、Chesseract。これらのデータセットと課題は、NAS開発における問題に注意を向け、開発時に未知のデータセット上でモデルがどのように機能するかを著者に検討するよう促すために開発されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:48:34 GMT)
Software-Defined Cryptography: A Design Feature of Cryptographic Agility [6.2]
Crypto-agilityは、新しい暗号アルゴリズムと標準へのアジャイルアップデートを可能にするデザイン機能である。本稿では,暗号処理の前提条件について検討し,その望まれる設計特徴について述べる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:11:58 GMT)
Rematch: Robust and Efficient Matching of Local Knowledge Graphs to Improve Structural and Semantic Similarity [6.2]
我々は,新しいAMR類似度指標であるrematchを導入し,RAREと呼ばれる構造類似度の評価を行った。 Rematchは構造的類似度で2位、第1位はSTS-BとSICK-Rのベンチマークで1～5ポイントのセマンティック類似度で2位である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:33:00 GMT)
Real, fake and synthetic faces - does the coin have three sides? [6.2]
本稿では, 実像, ディープフェイク像, 合成顔画像の傾向とパターンを新たに検討する。我々は8つのディープラーニングモデルを導入し、それらのパフォーマンスを分析して、3つの画像のクラスを区別する。この分析は、顔画像生成のためのより良いアルゴリズムを構築するのに役立つだけでなく、合成、ディープフェイク、および実際の顔画像が実際には3つの異なるクラスであることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:08:26 GMT)
A Generative Deep Learning Approach for Crash Severity Modeling with Imbalanced Data [6.2]
本研究では,条件付きタブラリGANに基づくクラッシュデータ生成手法を提案する。分類と解釈の性能を推定するために、クラッシュ重大度モデルを用いる。以上の結果から,CTGAN-RUが生成した合成データを用いた衝突重大度モデリングは,他の再サンプリング法により生成された原データや合成データよりも優れていたことが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:07:27 GMT)
Separating and Learning Latent Confounders to Enhancing User Preferences Modeling [6.1]
我々は、推薦のための新しいフレームワーク、SLFR(Separating and Learning Latent Confounders for Recommendation)を提案する。 SLFRは、未測定の共同設立者の表現を取得し、ユーザ嗜好と未測定の共同設立者を遠ざけ、反実的なフィードバックを識別する。 5つの実世界のデータセットで実験を行い、本手法の利点を検証した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:31:59 GMT)
Contrastive Credibility Propagation for Reliable Semi-Supervised Learning [6.0]
逐次的擬似ラベルリファインメントによる深部SSLのためのコントラストCCP(Contrastive Credibility Propagation)を提案する。 CCPは、教師付きベースラインをデータシナリオで確実に上回るために、半教師付き学習とノイズの多いラベル学習を統一する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 00:44:45 GMT)
A Methodology for Improving Accuracy of Embedded Spiking Neural Networks through Kernel Size Scaling [6.0]
Spiking Neural Networks(SNN)は、機械学習ベースのアプリケーションに対して、超低電力/エネルギー消費を提供する。現在、ほとんどのSNNアーキテクチャはより高精度なモデルサイズを必要とする。本稿では,カーネルサイズスケーリングによるSNNの精度向上手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:42:14 GMT)
Contextual Embedding Learning to Enhance 2D Networks for Volumetric Image Segmentation [6.0]
2次元畳み込みニューラルネットワーク(CNN)は、体積データの空間的相関をほとんど利用できない。本研究では,空間情報を適切にキャプチャする2次元CNNを実現するためのコンテキスト埋め込み学習手法を提案する。提案手法では,学習した埋め込みとスライスワイズマッチングをソフトキューとして活用し,ネットワークを誘導する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:17:39 GMT)
FraGNNet: A Deep Probabilistic Model for Mass Spectrum Prediction [5.9]
複合質量スペクトルモデル(C2MS)は、予測されたスペクトルで実ライブラリを増大させることで、検索率を向上させることができる。我々は,C2MS予測のための新しい確率的手法であるFraGNNetを開発し,高分解能スペクトルを効率的に正確に予測する。提案モデルでは,予測誤差の観点から最先端性能を実現し,検索ベースMS2Cのツールとして既存のC2MSモデルを上回っている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:16:15 GMT)
EGTR: Extracting Graph from Transformer for Scene Graph Generation [5.9]
SGG(Scene Graph Generation)は、オブジェクトを検出し、オブジェクト間の関係を予測するための課題である。本稿では,DETRデコーダのマルチヘッド自己アテンション層で学習した様々な関係から関係グラフを抽出する軽量一段SGGモデルを提案する。本稿では,Visual Genome と Open Image V6 データセットに対する提案手法の有効性と有効性を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:20:02 GMT)
MasonTigers at SemEval-2024 Task 1: An Ensemble Approach for Semantic Textual Relatedness [5.9]
本稿では,SemEval-2024 Task 1 - Semantic Textual RelatednessのMasonTigersエントリについて述べる。このタスクには、教師なし(Track A)、教師なし(Track B)、14言語にわたる言語横断(Track C)アプローチが含まれる。我々のアプローチは、トラックAで11位から21位、トラックBで1位から8位、トラックCで5位から12位までランク付けした。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:42:13 GMT)
Great, Now Write an Article About That: The Crescendo Multi-Turn LLM Jailbreak Attack [5.9]
我々は、Crescendoと呼ばれる新しいジェイルブレイク攻撃を導入する。 Crescendoはマルチターンのジェイルブレイクで、一見良心的な方法でモデルと対話する。我々はChatGPT, Gemini Pro, Gemini-Ultra, LlaMA-2 70b Chat, Anthropic Chatなど,様々な公共システム上でのCrescendoの評価を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:45:49 GMT)
EDTalk: Efficient Disentanglement for Emotional Talking Head Synthesis [5.8]
本稿では, 対話音声生成のための効率的な分散化フレームワーク(EDTalk)を提案する。本フレームワークは,映像や音声の入力に対して,口形状,頭部ポーズ,感情表現を個別に操作することを可能にする。 EDTalkの有効性を示す実験を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:32:39 GMT)
NEDS-SLAM: A Novel Neural Explicit Dense Semantic SLAM Framework using 3D Gaussian Splatting [5.7]
本稿では,3次元ガウス表現に基づく明示的DenseセマンティックSLAMシステムNEDS-SLAMを提案する。本研究では,事前学習したセグメンテーションヘッドからの誤推定の影響を低減するために,空間一貫性のある特徴融合モデルを提案する。我々は,高次元意味的特徴をコンパクトな3次元ガウス表現に圧縮するために,軽量エンコーダデコーダを用いる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:55:28 GMT)
Deciphering the Interplay between Local Differential Privacy, Average Bayesian Privacy, and Maximum Bayesian Privacy [5.6]
我々はベイジアン・プライバシを導入し、LDPとベイジアン・プライバシ・トレードオフに関する新たな洞察を公表した。私たちの研究は、将来の経験的探索の基盤となるだけでなく、プライバシー保護アルゴリズムの設計を促進することを約束しています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:28:06 GMT)
CATP: Cross-Attention Token Pruning for Accuracy Preserved Multimodal Model Inference [5.6]
本稿では,高精度なトークンプルーニング手法であるクロスアテンショントークンプルーニング(CATP)を紹介する。評価では、CATPは既存のトークンプルーニング法と比較して最大12.1倍高い精度を達成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:35:35 GMT)
Statistical inference for pairwise comparison models [5.5]
本稿では、ペアワイズ比較モデルの幅広いクラスにおいて、最大極大に対する準最適正規性を確立する。鍵となる考え方は、フィッシャー情報行列を重み付きグラフラプラシアンとして同定することである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:42:13 GMT)
Navigating the Post-API Dilemma | Search Engine Results Pages Present a Biased View of Social Media Data [5.5]
ソーシャルメディアAPIへのアクセスを中止するという最近の決定は、インターネット研究に有害な影響を及ぼしている。このデータへのアクセスの欠如は、インターネット研究のポストAPI時代と呼ばれる。幸いなことに、人気のある検索エンジンは、適切な検索クエリを提供すると、検索結果ページ(SERP)でソーシャルメディアデータをクロール、キャプチャ、サーフェスする手段を持っている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:28:07 GMT)
Learning Memory Kernels in Generalized Langevin Equations [5.3]
一般化ランゲヴィン方程式におけるメモリカーネル学習のための新しい手法を提案する。このアプローチは最初、軌道データから相関関数を推定するために正規化Prony法を使用し、続いてRKHS正則化を伴うソボレフノルムに基づく損失関数の回帰を行う。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:04:09 GMT)
Event Causality Is Key to Computational Story Understanding [5.2]
本稿では,イベント因果同定のための最初の手法を提案する。下流のストーリー品質評価タスクでは、特定因果関係は3.6～16.6%の相対的改善をもたらす。この結果から, 事象因果関係を未然に把握できる可能性が示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:31:59 GMT)
Entanglement Islands from Hilbert Space Reduction [5.1]
ヒルベルト空間に残されている全ての状態に対して、その状態が別の部分集合$mathcalR_a$の状態にエンコードされている部分集合$I_a$が存在することを示す。このようなシステムを自己符号化と呼び、そのようなシステムの絡み合いエントロピーは、新しい島式によって計算されるべきであることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:25:55 GMT)
UINav: A Practical Approach to Train On-Device Automation Agents [5.0]
モバイル機器に適合する自動化エージェントをトレーニングするための,デモベースのアプローチであるUINavを提案する。わずか10のデモでUINavは70%の精度を達成でき、十分なデモで90%以上の精度を達成できる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:25:57 GMT)
Leveraging Digital Perceptual Technologies for Remote Perception and Analysis of Human Biomechanical Processes: A Contactless Approach for Workload and Joint Force Assessment [5.0]
本研究では,産業環境下での人間の動きの分析を目的とした,革新的なコンピュータビジョンフレームワークを提案する。このフレームワークは、人間の動作の包括的な精査を可能にし、運動パターンや運動データに関する貴重な洞察を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:12:00 GMT)
A Comprehensive Review of Knowledge Distillation in Computer Vision [4.9]
本稿では, 複雑なモデルをより小さく, より単純なものに圧縮する技術である, 知識蒸留研究の現状について検討する。本稿では,知識蒸留に関する主要な原則と技術の概要を述べるとともに,コンピュータビジョン分野における知識蒸留の応用について概説する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:55:27 GMT)
Dynamical characterization of $Z_{2}$ Floquet topological phases via quantum quenches [4.9]
我々は、Z_2$フロケ位相に対する最初の完全かつ統一的な力学的特徴付け理論を開発した。ストロボスコープによる時間平均スピン偏光によるフロケバンドの極小情報の計測により,ブリルアン帯の一部の離散モーメントに現れるトポロジカルスピンテクスチャパターンが明らかとなった。我々の研究は、$Z_2$Floquet位相を検出し、Floquet位相の全クラスに対する力学的特徴を完備化する、非常に実現可能な方法を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:19:04 GMT)
Auditing Large Language Models for Enhanced Text-Based Stereotype Detection and Probing-Based Bias Evaluation [4.9]
この研究は、ジェンダー、人種、職業、宗教、ステレオタイプテキストにわたる51,867のインスタンスを含むマルチグラインドステレオタイプデータセットを導入している。ステレオタイプ検出のためのベースラインを確立することを目的とした、さまざまな機械学習アプローチについて検討する。本研究では,多言語モデルを用いたテキスト生成タスクにおけるステレオタイプの存在を評価・評価する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:31:32 GMT)
Budget Recycling Differential Privacy [4.9]
幅広いDPメカニズムに対してソフトバウンドノイズ出力を提供するために設計された予算リサイクル微分プライバシー(BR-DP)フレームワーク。 BR-DPは2つのコンポーネントから構成される: 繰り返しごとにノイズの答えを生成するDPカーネルと、ノイズの答えを確率論的にリサイクルまたは再生するリサイクル器である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:50:16 GMT)
Robustly estimating heterogeneity in factorial data using Rashomon Partitions [4.8]
我々は、因子空間をプールに分割するために、羅生門分割集合(RPS)を用いる。 RPSは、たとえ実質的に異なる説明を提供するとしても、最大アフターディパーティションの近くに後続値を持つすべてのパーティションを組み込む。提案手法を,チャリタブルギフトの価格効果,染色体構造(テロメア長),マイクロファイナンス導入の3つの経験的設定に適用した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:53:28 GMT)
Safe Interval RRT* for Scalable Multi-Robot Path Planning in Continuous Space [4.7]
本研究では、競合のない経路を見つけるために、連続空間におけるMRPP(Multi-Robot Path Planning)の問題を考える。そこで本研究では,各ロボットの衝突のない軌道を検知するサンプリングベースプランナを低レベルに構成する2段階の手法を提案する。実験結果から,SI-RRT* は少数のサンプルで高速に高品質な解を見つけることができることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:07:12 GMT)
M2SA: Multimodal and Multilingual Model for Sentiment Analysis of Tweets [4.5]
本稿では,既存のテキスト型Twitter感情データセットを,簡単なキュレーションプロセスを通じてマルチモーダルフォーマットに変換する。本研究は,研究コミュニティにおける感情関連研究の新たな道を開くものである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:11:58 GMT)
Self-StrAE at SemEval-2024 Task 1: Making Self-Structuring AutoEncoders Learn More With Less [4.4]
補助的な目的として語彙の再構成を含めることで表現品質が向上することを示す。独立したチャネルの数を増やすことで、埋め込み品質が大幅に向上することを示す。我々のシステムは、入力データの1000万トークンをゼロから事前訓練することができ、英語、スペイン語、アフリカーンで有効であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:38:11 GMT)
Security for adversarial wiretap channels [4.4]
抽出器の逆数と誤り訂正符号を用いる情報理論的に安全な符号化方式を解析する。これは、メモリを持つ特定のチャネルタイプにも当てはまります。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:22:40 GMT)
A neural network-based approach to hybrid systems identification for control [4.3]
本稿では,断片的なアフィン・ダイナミックスを持つハイブリッドシステムを実現するニューラルネットワークアーキテクチャを提案する。 NNベースの手法は,ハイブリッドシステムにおける最先端のシステム識別手法と非常によく似た性能を持つことを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:16:30 GMT)
Zero-Shot Multi-Lingual Speaker Verification in Clinical Trials [4.2]
臨床試験では、患者の音声データに基づいて、認知や精神の健康障害を検出し、モニターする。我々は,これらの音声記録を用いて,登録患者の身元を確認し,同じ臨床試験で複数回登録しようとする個人を特定し,排除することを提案する。我々は、英語、ドイツ語、デンマーク語、スペイン語、アラビア語を母語とする言語障害者を対象に、事前訓練したTitaNet, ECAPA-TDNN, SpeakerNetモデルの評価を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:19:30 GMT)
VC dimension of Graph Neural Networks with Pfaffian activation functions [4.1]
グラフニューラルネットワーク(GNN)は、近年、広範囲のグラフドメインでタスクを学習する強力なツールとして登場している。我々の研究の目的は、GNNのVC次元に関するこの分析を、シグモイドや双曲タンジェントといった他のよく使われる活性化関数に拡張することである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:30:38 GMT)
Sentiment Analysis of Citations in Scientific Articles Using ChatGPT: Identifying Potential Biases and Conflicts of Interest [4.1]
本稿では,大規模言語モデル,特にChatGPTの科学的論文における引用の包括的感情分析における革新的利用について紹介する。 ChatGPTは引用のニュアンスな肯定性や否定性を識別することができ、引用された作品の受信と影響に関する洞察を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:59:49 GMT)
LLM meets Vision-Language Models for Zero-Shot One-Class Classification [4.1]
ゼロショットワンクラス視覚分類の問題を考える。本稿では、視覚的に混乱するオブジェクトに対して、まず大きな言語モデルをクエリする2段階のソリューションを提案する。我々は,そのラベルのみを用いて,一つのカテゴリと他のセマンティックなカテゴリを識別可能であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:59:05 GMT)
Effective Malware Detection for Embedded Computing Systems with Limited Exposure [4.0]
そこで本研究では,限定的なマルウェアの複数の変異サンプルを生成するコード認識データ生成手法を提案する。損失最小化は、生成したサンプルが限られたマルウェアを忠実に模倣し、非現実的なサンプルを緩和することを保証する。提案手法は,最先端技術により得られた精度の約3倍のマルウェアを検知し,90%の精度で検出する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:37:34 GMT)
PATCH -- Psychometrics-AssisTed benCHmarking of Large Language Models: A Case Study of Mathematics Proficiency [3.9]
Psycho-AssisTedCHは、大規模(マルチモーダル)言語モデルの既存のベンチマークの限界に対処する。心理測定に基づくアプローチを採用すると、既存のベンチマークプラクティスに基づく評価結果と異なる評価結果が得られることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:58:57 GMT)
Voice EHR: Introducing Multimodal Audio Data for Health [3.9]
本報告では、モバイル/ウェブアプリケーションのみを用いて、ガイド付き質問を通じて健康データをキャプチャする新しいデータ型とそれに対応する収集システムを紹介する。このアプリケーションは最終的に、従来の音声/呼吸機能、音声パターン、意味のある言語から健康の複雑なバイオマーカーを含む音声電子健康記録(ボイスEHR)をもたらす。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:07:22 GMT)
On Automating Video Game Regression Testing by Planning and Learning [3.7]
本稿では,あるゲーム面の回帰テストを自動化する手法とワークフローを提案する。基本的な考え方は、詳細なゲームログとインクリメンタルアクションモデル学習技術を使用して、フォーマルモデルを維持することである。本稿では,ワークフローにおけるモデリング専門家の必要性を最小限に抑えるか,あるいは取り除くための第一歩を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:16:14 GMT)
Super-Resolution Analysis for Landfill Waste Classification [3.7]
違法な埋立地は環境、経済、公衆衛生への影響から重要な問題である。本研究は環境犯罪監視に航空画像を利用する。画像品質の向上による性能向上が観察されたが, モデル感度に影響を及ぼし, 慎重にしきい値の微調整が必要であった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:53:20 GMT)
Learning quantum properties from short-range correlations using multi-task networks [3.7]
相関長が一定である多体量子状態の様々な量子特性を予測できるニューラルネットワークモデルを提案する。このモデルはマルチタスク学習の技術に基づいており、従来のシングルタスクアプローチよりもいくつかの利点があることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:06:26 GMT)
Lifelong Continual Learning for Anomaly Detection: New Challenges, Perspectives, and Insights [3.7]
生涯の異常検出は、より広く検討された分類設定と比較して本質的に異なる課題をもたらす。まず,生涯学習の複雑さに対処する異常検出手法を設計するための課題と機会を定義する。第3に,生涯学習の導入によって得られるパフォーマンスのギャップを強調することを目的として,提案した生涯シナリオに対する一般的な異常検出手法を用いた実験を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:01:05 GMT)
Digital Forgetting in Large Language Models: A Survey of Unlearning Methods [3.6]
この調査は、大きな言語モデル(LLM)の忘れ方に焦点を当てている。まず、LLMのコンポーネント、LLMのタイプ、通常のトレーニングパイプラインなど、LLMのバックグラウンドを提供します。次に,デジタル忘れることの動機,タイプ,望ましい特性について述べる。第3に,LLMにおけるデジタル忘れへのアプローチを紹介する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:01:18 GMT)
Recursive Joint Cross-Modal Attention for Multimodal Fusion in Dimensional Emotion Recognition [3.6]
本稿では,RJCMA(Recursive Joint Cross-Modal Attention)を導入し,音声,視覚,テキストの両モード間の相互関係を次元的感情認識のために捉える。特に,共同音声・視覚・テキスト特徴表現と個々のモーダルの特徴表現との相互相関に基づく注目重みの計算を行う。 Affwild2データセット上で提案した核融合モデルの性能を評価するために大規模な実験を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:42:50 GMT)
Transfer Learning from Whisper for Microscopic Intelligibility Prediction [3.6]
最先端のマクロモデルでは,大規模深層学習モデルからの伝達学習を用いて音声処理を行う。音声認識のための最先端深層学習モデルであるWhisperからの伝達学習を顕微鏡的インテリジェンス予測に利用することを検討した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:53:51 GMT)
Online Uniform Risk Times Sampling: First Approximation Algorithms, Learning Augmentation with Full Confidence Interval Integration [3.5]
デジタルヘルスにおいて、リスクタイムを超えて限られた治療予算を割り当てる戦略は、ユーザの疲労を軽減するために不可欠である。本稿では,近似アルゴリズムフレームワーク内でのオンライン一様リスク時間サンプリング問題について,初めて紹介する。本稿では,この問題に対する2つのオンライン近似アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:10:33 GMT)
LastResort at SemEval-2024 Task 3: Exploring Multimodal Emotion Cause Pair Extraction as Sequence Labelling Task [3.5]
SemEval 2024は会話におけるマルチモーダル感情原因分析のタスクを導入している。本稿では,この課題を発話ラベリングとシーケンスラベリングの問題として扱うモデルを提案する。このタスクの公式リーダーボードでは、私たちのアーキテクチャは8位にランクされ、リーダーボードのF1スコアは0.1759でした。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:32:49 GMT)
RTPS Attack Dataset Description [3.4]
正常状態の無人地上車両(UGV)に攻撃データを注入することにより,悪意のあるパケットデータを収集する。テストベッド上では2種類の攻撃「コマンドインジェクション」と「ARPスポーフィングを用いたコマンドインジェクション」を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:28:31 GMT)
Learning to Generate Conditional Tri-plane for 3D-aware Expression Controllable Portrait Animation [3.4]
Export3Dは、与えられたポートレート画像の表情とカメラビューを制御することができるワンショット3D対応のポートレートアニメーションである。本モデルでは,3次元表示制御可能なポートレート画像を生成することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:31:50 GMT)
Poro 34B and the Blessing of Multilinguality [3.3]
Poro 34Bは、フィンランド語、英語、プログラミング言語の1兆トークンのために訓練された34億のパラメータモデルである。フィンランド語における既存モデルの能力を大幅に向上するモデルを,多言語学習アプローチにより生成できることが示される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:34:12 GMT)
Guidelines for Cerebrovascular Segmentation: Managing Imperfect Annotations in the context of Semi-Supervised Learning [3.2]
教師付き学習法は、十分な量のラベル付きデータを入力した場合に優れた性能を達成する。このようなラベルは一般的に、非常に時間がかかり、エラーが発生し、製造コストがかかる。半教師付き学習アプローチはラベル付きデータとラベルなしデータの両方を活用する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:31:06 GMT)
CMAT: A Multi-Agent Collaboration Tuning Framework for Enhancing Small Language Models [3.2]
厳密にキュレートされた高品質データセットに基づいてトレーニングされたTinyAgentモデルを紹介する。また,言語エージェントの能力向上を目的とした革新的システムであるCMAT(Collaborative Multi-Agent Tuning)フレームワークを提案する。本研究では,マルチエージェントシステムと環境フィードバック機構を統合した新しいコミュニケーションエージェントフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:07:35 GMT)
CFIR: Fast and Effective Long-Text To Image Retrieval for Large Corpora [3.2]
本稿では,高速かつ効率的な画像検索のための2段階の粗度指数共有検索(CFIR)フレームワークを提案する。 CFIRは、Recall@1000で既存のMLLMを最大11.06%上回り、トレーニング時間と検索時間をそれぞれ68.75%、99.79%削減している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:54:46 GMT)
KazParC: Kazakh Parallel Corpus for Machine Translation [3.1]
KazParCは、カザフ語、英語、ロシア語、トルコ語にまたがる機械翻訳用に設計された並列コーパスである。我々の研究は、Tilmashと呼ばれるニューラルマシン翻訳モデルの開発にも及んでいる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:08:25 GMT)
Visual Deformation Detection Using Soft Material Simulation for Pre-training of Condition Assessment Models [3.0]
オープンソースのシミュレーションツールであるBlenderを使用して、機械学習(ML)モデルのための合成データセットを作成することを提案する。このプロセスでは、専門家情報を形状キーパラメータに翻訳して変形をシミュレートし、変形したオブジェクトと非変形したオブジェクトの両方のイメージを生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:58:53 GMT)
Task Integration Distillation for Object Detectors [3.0]
本稿では,分類作業と回帰作業の両方に対処する知識蒸留法を提案する。検出器の2つのサブタスクの出力に基づいて特徴の重要性を評価する。この方法は、モデルの学習現実に関するバイアス付き予測の問題を効果的に防止する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:08:15 GMT)
HALO: An Ontology for Representing and Categorizing Hallucinations in Large Language Models [2.9]
Hallucination Ontology (HALO) はOWLで書かれており、大きな言語モデル(LLM)で見られる6種類の幻覚をサポートしている。我々は,複数の独立したWebソースに対して帰納的に収集した幻覚を含むデータセットを公開し,このデータセットをモデル化し,有能な質問に答えるためにHALOをうまく利用できることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:55:52 GMT)
SelfPose3d: Self-Supervised Multi-Person Multi-View 3d Pose Estimation [2.9]
複数のカメラビューから複数の人の3dポーズを推定する自己教師型アプローチであるSelfPose3dを提案する。現在の最先端の完全教師付き手法とは異なり、我々の手法は2次元または3次元の地平線ポーズを必要としない。 Panoptic、Shelf、Campusを含む3つの公開ベンチマークデータセットの実験と分析は、我々のアプローチの有効性を示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:34:52 GMT)
CICLe: Conformal In-Context Learning for Largescale Multi-Class Food Risk Classification [2.9]
トレーニング用のラベル付きWebテキストセットが与えられたら、機械学習と自然言語処理を適用して、そのようなリスクを自動的に検出することができる。我々は,公開食品リコール発表を記述した7,546の短いテキストのデータセットを公開している。データセットとベンチマークナイーブ、従来型、トランスフォーマーモデルについて説明する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:25:34 GMT)
QDarts: A Quantum Dot Array Transition Simulator for finding charge transitions in the presence of finite tunnel couplings, non-constant charging energies and sensor dots [2.8]
QDartsは、平衡状態にある量子ドットアレイ(QDA)デバイスの現実的な電荷安定性図のシミュレータである。これには、有限トンネル結合、非定常充電エネルギー、ノイズの多いセンサドットのシミュレーションなどが含まれる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:05:53 GMT)
Specularity Factorization for Low-Light Enhancement [2.8]
本稿では,複数の潜伏成分からなる画像を扱う付加的な画像分解手法を提案する。当社のモデル駆動型EM RSFNetは,最適化をネットワーク層に展開することで,これらの要因を推定する。結果の因子は設計によって解釈可能であり、ネットワークを介して異なる画像強調タスクに融合したり、直接ユーザによって結合したりすることができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:41:42 GMT)
AutoTRIZ: Artificial Ideation with TRIZ and Large Language Models [2.8]
TRIZリソースと概念の複雑さは、ユーザの知識、経験、推論能力への依存と相まって、その実践性を制限する。本稿では,大規模言語モデル(LLM)を活用してTRIZ手法の自動化と拡張を行う,人工的思考ツールであるAutoTRIZを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:38:05 GMT)
Understanding Energy Level Structure Using Quantum Rubik's Cube [2.7]
この研究は、量子ルービックキューブ行列とベナルカザール・ベルネヴィグ・ヒューズモデルを組み合わせたものである。量子ルービックキューブ行列の操作をより明確にするために、ジョゼフス環を用いてルービックキューブ拡大の位相グラフを描く。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:18:45 GMT)
Conjugate-Gradient-like Based Adaptive Moment Estimation Optimization Algorithm for Deep Learning [2.7]
本稿では,ディープラーニングのためのCG-like-Adamという新しい最適化アルゴリズムを提案する。具体的には、ジェネリック・アダムの第1次と第2次モーメント推定の両方を共役次数様に置き換える。 CIFAR10/100データセットに基づく提案アルゴリズムの優位性を示す数値実験を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:57:17 GMT)
Generative AI-Based Text Generation Methods Using Pre-Trained GPT-2 Model [2.6]
この研究は自動テキスト生成の領域を掘り下げ、伝統的な決定論的アプローチからより近代的な手法まで様々な手法を探求した。欲求探索、ビームサーチ、トップクサンプリング、トップpサンプリング、コントラスト探索、および局所的な典型探索の分析を通じて、この研究は各手法の強み、弱み、および潜在的な応用に関する貴重な洞察を与えてきた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:49:53 GMT)
Unified Control Framework for Real-Time Interception and Obstacle Avoidance of Fast-Moving Objects with Diffusion Variational Autoencoder [2.6]
動的環境におけるロボットアームによる高速移動物体のリアルタイムインターセプションは、非常に困難な課題である。本稿では,動的オブジェクトを同時にインターセプトし,移動障害を回避することで,課題に対処する統一的な制御フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:27:36 GMT)
A Holistic Indicator of Polarization to Measure Online Sexism [2.5]
ソーシャルネットワークにおけるマノアとフェミニストの議論のオンライン傾向は、オンラインコミュニティにおける性差別のレベルを包括的に測定する必要がある。この指標は、オンラインコミュニティの政策立案者やモデレーターにとって重要である。我々は、男性と女性のアイデンティティと男女の個人を対象とする毒性の総合的な指標を提供するモデルを構築した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:00:42 GMT)
Towards a New Configurable and Practical Remote Automotive Security Testing Platform [2.5]
我々は、車両のサイバーセキュリティテストと研究領域におけるいくつかの課題に対処する次世代のテストプラットフォームを提案する。車両セキュリティエンジニアリングクラウド(VSEC)テストプラットフォームは、効率的な車両サイバーセキュリティテストと高度な(例えば、侵入、ファズ)テストのためのテストベッドへのアクセスを容易にする方法について詳述する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:40:12 GMT)
KTPFormer: Kinematics and Trajectory Prior Knowledge-Enhanced Transformer for 3D Human Pose Estimation [2.5]
我々は、Kinematics Prior Attention (KPA) と Trajectory Prior Attention (TPA) の2つの事前注意モジュールを提案する。 KPAは運動学のトポロジを構築して人体の運動関係をモデル化し、TPAは軌道トポロジを構築し、フレーム間の関節運動のトポロジの情報を学習する。 3つのベンチマーク(Human3.6M、MPI-INF-3DHP、HumanEva)の大規模な実験は、KTPFormerが最先端の手法と比較して優れた性能を発揮することを示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:15:15 GMT)
Keeping Behavioral Programs Alive: Specifying and Executing Liveness Requirements [2.4]
タスクがまだ完了していないことを示すために,"must-finish"を付けたタグ付け状態のイディオムを提案する。また,B"uchiautoaへの翻訳に基づくセマンティクスと,マルコフ決定プロセス(MDP)に基づく2つの実行メカニズムも提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:36:58 GMT)
Faked Speech Detection with Zero Prior Knowledge [2.4]
本稿では,入力音声を実物または模倣物として盲目的に分類する分類器を開発するニューラルネットワーク手法を提案する。本稿では,3層を隠蔽し,重層と落層を交互に交互に配置した逐次モデルに基づくディープニューラルネットワークを提案する。人間の観察者の場合の85%の精度に対して、テストケースの94%の正確な分類が得られた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:58:15 GMT)
A Feature Dataset of Microservices-based Systems [2.4]
データセットの設計と開発における粗悪なプラクティスは、マイクロサービスの悪臭と呼ばれる。適切なオープンソースのマイクロサービス機能データセットがない。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:52:18 GMT)
Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context [2.3]
アフリカ語のみに特化して訓練された最初の自己教師型多言語音声モデルを提案する。このモデルは、サハラ以南のアフリカで話されている21の言語と方言で、6万時間近い未ラベルの音声セグメントから学習された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:43:36 GMT)
"Against the Void": An Interview and Survey Study on How Rust Developers Use Unsafe Code [2.2]
Rustは、エイリアスと変更性を制限することで安全性を保証する。サイクリックエイリアスやマルチオペレーティングといった重要なデザインパターンは、これらの制限を回避しなければならない。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:36:21 GMT)
High-performance real-world optical computing trained by in situ model-free optimization [2.2]
モンテカルロ勾配推定アルゴリズムに基づく勾配に基づくモデルフリー最適化(G-MFO)手法を提案する。 G-MFOは、光学計算システムをブラックボックスとして扱い、光学計算重みの確率分布に直接損失をバックプロパガンダする。 G-MFO は MNIST と FMNIST のハイブリッドトレーニングより優れていることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:25:10 GMT)
Using the Empirical Attainment Function for Analyzing Single-objective Black-box Optimization Algorithms [2.1]
実験的達成関数(EAF)は,対象とするECDFに対していくつかの利点がある。 EAFは、関数毎の品質目標を定義する必要はなく、パフォーマンスの違いをより正確に捉え、追加の要約統計を使用することを可能にしている。 EAFのアクセシビリティを容易にするため、IOHanalyzerプラットフォームにモジュールを統合して計算する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:18:22 GMT)
Can My Microservice Tolerate an Unreliable Database? Resilience Testing with Fault Injection and Visualization [2.1]
データベースクライアントのフォールトインジェクションの拡張を開発し、Filibusterに統合しました。我々のツールは、データベースの破壊を体系的にシミュレートし、アプリケーションレジリエンスの包括的なテストと評価を可能にする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:26:04 GMT)
LR-FPN: Enhancing Remote Sensing Object Detection with Location Refined Feature Pyramid Network [2.0]
浅い位置情報の抽出を促進するために,新しい位置改良型特徴ピラミッドネットワーク(LR-FPN)を提案する。 2つの大規模なリモートセンシングデータセットの実験により、提案したLR-FPNは最先端のオブジェクト検出手法よりも優れていることが示された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:36:07 GMT)
PeersimGym: An Environment for Solving the Task Offloading Problem with Reinforcement Learning [2.0]
計算ネットワークにおけるタスクオフロード戦略の開発と最適化に適した,オープンソースのカスタマイズ可能なシミュレーション環境であるPeersimGymを紹介する。 PeersimGymは、幅広いネットワークトポロジと計算制約をサポートし、TextitPettingZooベースのインターフェイスを統合して、RLエージェントのデプロイを、単体とマルチエージェントの両方で行えるようにしている。本稿では,分散コンピューティング環境におけるオフロード戦略を大幅に強化するRLベースのアプローチの可能性を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:17:30 GMT)
Precise and Robust Sidewalk Detection: Leveraging Ensemble Learning to Surpass LLM Limitations in Urban Environments [2.0]
この研究は、Cityscapes、Ade20k、およびBostonデータセットにおけるモデルのパフォーマンスを評価した。アンサンブルモデルは個々のモデルよりも優れ、平均インターセクション・オーバー・ユニオン(MIIOU)スコアは93.1%、90.3%、90.6%に達した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:42:32 GMT)
Emergence of Chemotactic Strategies with Multi-Agent Reinforcement Learning [1.9]
ケモタキシーの訓練において,強化学習が生物学的システムに対する洞察を与えることができるかどうかを検討する。各種エージェントの形状,サイズ,水泳速度をシミュレーションし,生物学的水泳選手の身体的制約,すなわちブラウン運動が,強化学習者のトレーニングが失敗する地域につながるかどうかを判定する。 RLの薬剤は、物理的に可能であればすぐに遊泳でき、場合によっては、アクティブスイミングが環境を圧倒する前にも、遊泳が可能であることが判明した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:42:52 GMT)
Multicore DRAM Bank-& Row-Conflict Bomb for Timing Attacks in Mixed-Criticality Systems [1.8]
悪意のあるエンティティは、共有リソースを利用して、クリティカルなアプリケーションに対するタイミングアタックを作成することができる。本稿では,共有DRAM二重インラインメモリモジュールの理解に焦点をあてて,「バンク・アンド・行衝突爆弾」と命名したタイミング攻撃を発生させた。 8GBのDDR4-2666 DRAMモジュールを搭載した第2世代Intel Xeonプロセッサで実験を行い、そのような攻撃が被害者タスクの実行時間を約150%増加させることを示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:57:20 GMT)
A Deep Learning-based Pest Insect Monitoring System for Ultra-low Power Pocket-sized Drones [1.8]
スマート農業と精密農業は、効率的で持続可能な農業のためのゲームチェンジャー技術である。小型のパームサイズのドローンは、作物を検査する柔軟なスマートセンサーとして機能し、害虫の早期発生の兆候を探すことができる。この研究は、2つの超低消費電力のSystem-on-Chipsを備えた新しい垂直統合ソリューションを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:39:54 GMT)
Decoding the Sociotechnical Dimensions of Digital Misinformation: A Comprehensive Literature Review [1.7]
このレビューは、SCOPUS、IEEE、ACMデジタルライブラリーによる788の研究から成っており、主要な研究方向と社会技術的課題を合成している。このマッピングは、誤情報の概念に関する問題を特定し、緩和戦略の欠陥を強調し、ステークホルダーにアプローチする際の課題を議論し、デジタル誤情報の有害な影響を理解し緩和することに関連する様々な社会技術的側面を明らかにする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:09:27 GMT)
Evolution and Efficiency in Neural Architecture Search: Bridging the Gap Between Expert Design and Automated Optimization [1.7]
本稿では,ニューラルネットワーク検索の概要について概説する。手動設計から自動化された計算駆動アプローチへの進化を強調している。医療画像や自然言語処理など、さまざまな分野の応用を強調している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:35:04 GMT)
Activation Steering for Robust Type Prediction in CodeLLMs [1.7]
CodeLLMsを構文的邪魔者に対してより堅牢にするために、推論時間技術に貢献する。我々は、徐々に型付けされた言語であるPythonとTypeScriptの型予測タスクに、我々のアプローチを適用した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:44:44 GMT)
Cooperative Students: Navigating Unsupervised Domain Adaptation in Nighttime Object Detection [1.7]
教師なし領域適応 (Unsupervised Domain Adaptation, UDA) は、厳密な条件下での物体検出において顕著な進歩を示した。 UDAのパフォーマンスは特に夜間の低可視性シナリオで低下する。この問題に対処するため,textbfCooperative textbfStudents (textbfCoS) フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:26:18 GMT)
Advancements in Point Cloud Data Augmentation for Deep Learning: A Survey [1.6]
ディープラーニング(DL)は、ポイントクラウド分析タスクの主流で効果的な方法の1つになっています。ポイントクラウドデータ拡張方法は、さまざまなポイントクラウド処理タスクで広く利用されている。本稿では、これらの手法を調査し、基本的および専門的なポイントクラウドデータ拡張手法を含む分類フレームワークに分類する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:14:57 GMT)
FLIGAN: Enhancing Federated Learning with Incomplete Data using GAN [1.6]
Federated Learning (FL)は、ネットワークデバイス上での機械学習モデルの分散トレーニングのためのプライバシ保護メカニズムを提供する。本稿では,FLにおけるデータ不完全性問題に対処する新しいアプローチであるFLIGANを提案する。本手法はFLのプライバシ要件に則り,プロセス内の実際のデータを共有せずに合成データをフェデレートした方法で生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:33:06 GMT)
A Causal Model for Quantifying Multipartite Classical and Quantum Correlations [1.5]
我々は、与えられた複数の古典的あるいは量子的相関の中で情報理論資源の操作的定義を与える。我々は、古典的な機密性以外にも、分散コンピューティング問題のセキュリティに有用な追加のリソースが存在すると論じている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:26:13 GMT)
One Noise to Rule Them All: Multi-View Adversarial Attacks with Universal Perturbation [1.5]
本稿では,3次元物体認識における頑健な多視点対角的例を生成するために,新しい普遍摂動法を提案する。単一のビューに制限された従来の攻撃とは異なり、我々のアプローチは複数の2Dイメージで動作し、実用的でスケーラブルなソリューションを提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:29:59 GMT)
Helmsman of the Masses? Evaluate the Opinion Leadership of Large Language Models in the Werewolf Game [1.5]
我々はWerewolfのゲームをシミュレーションプラットフォームとして利用し、大規模言語モデル(LLM)の意見リーダーシップを評価する。ゲームは保安官の役割を特徴とし、議論を要約し、決定オプションを推奨する。我々は、意見のリーダーの批判的特徴に基づいて、評価のための2つの新しい指標を考案した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:46:18 GMT)
Atomic magnetometry using a metasurface polarizing beamsplitter in silicon on sapphire [1.4]
シリコン・オン・サファイア(SOS)プラットフォーム上に作製した準曲面偏光ビームスプリッタを用いて原子磁気計測を行った。我々は、非線形磁気光学回転と測定サブナオテスラ感度に基づく原子磁気センサに準曲面を組み込んだ。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:56:40 GMT)
Realtime Person Identification via Gait Analysis [1.3]
エッジAIデプロイメントとリアルタイム歩行認識に非常に適した4層を有する小型CNNモデルを提案する。我々のモデルは96.7%の精度で5KBのRAMしか消費せず、起動時間は70msと125mWである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:15:06 GMT)
SCAPE: Searching Conceptual Architecture Prompts using Evolution [1.3]
SCAPEは、シンプルなポイントアンドクリックインターフェースを通じて、最初の入力にインスパイアされた創造的で高品質なデザインを探索するツールです。生成AIにランダム性を注入し、GPT-4の組み込み言語スキルを利用してメモリを可能にする。 SCAPEでは、画像のノベルティが67%向上し、品質と使用効率が向上する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:05:33 GMT)
Long-range dipole-dipole exchange-induced atomic grating [1.2]
我々は,超低温ルビジウム (87$Rb) 原子アンサンブルと可動リドバーグスピン原子からなるハイブリッドシステムに基づく双極子交換誘起格子(DEIG)の理論スキームを提案する。格子の光学的応答は、双極子遮断効果による協調光学的非線形効果と同様に、3段と4段の配置の重畳として現れる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:37:18 GMT)
A Computational Analysis of Lyric Similarity Perception [1.2]
人間の知覚との類似性をモデル化するための計算手法の比較分析を行う。以上の結果から,事前学習したBERTモデルからの埋め込み,歌詞が導出される音声,知覚的歌詞の類似性を示す音声成分の類似性に基づく計算モデルが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:31:38 GMT)
LLMs in the Loop: Leveraging Large Language Model Annotations for Active Learning in Low-Resource Languages [1.1]
低リソース言語は、限られた言語資源とデータラベリングの専門知識のために、AI開発において重大な障壁に直面している。データアノテーションのアクティブ学習ループにおけるLLMの可能性を活用することを提案する。 GPT-4-Turboを用いた実証的な評価では、データ要求が大幅に削減され、最先端の性能が実証された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:34:22 GMT)
Efficient Syndrome Decoder for Heavy Hexagonal QECC via Machine Learning [1.1]
近年の進歩により、トポロジカルコードは機械学習(ML)技術の展開によって効率的に復号化可能であることが示されている。まず、ヘキサゴナルコードのためのMLベースのデコーダを提案し、しきい値と擬似閾値の値でその効率性を確立する。等価なエラークラスを決定するランクに基づく新しい手法が提案され、線形探索に基づくクラスよりも経験的に高速である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:51:00 GMT)
Quantum illumination with noisy probes: Conditional advantages of non-Gaussianity [1.0]
2モードの圧縮真空状態のように絡み合った状態は、照明プロトコルにおいて量子的に有利であることが知られている。非ガウス光子付加および減光状態は、全方位熱雑音の上の局所ガウス雑音の影響を受け、照明プロトコルのプローブとして用いる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:42:38 GMT)
Systematic Solutions to Login and Authentication Security: A Dual-Password Login-Authentication Mechanism [1.0]
認証盗難とリモート攻撃は、認証メカニズムに対する最も深刻な脅威である。ユーザの選択した秘密のログインパスワードを,認証不能なパスワードに変換する,デュアルパスワードのログイン認証機構を設計する。ログインパスワードの認証可能機能と、認証パスワードのタイプ可能な機能とを無効又は無効にすることができ、クレデンシャル盗難やリモート攻撃を防止できる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:05:47 GMT)
JMI at SemEval 2024 Task 3: Two-step approach for multimodal ECAC using in-context learning with GPT and instruction-tuned Llama models [1.0]
本稿では,SemEval-2024タスク3におけるシステム開発について述べる:「会話におけるマルチモーダル感情原因分析の競争」人間の会話における感情を効果的に捉えるには、テキスト、オーディオ、ビデオなどの複数のモダリティを統合する必要がある。提案手法は2段階の枠組みでこれらの課題に対処する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:52:37 GMT)
Classification for everyone : Building geography agnostic models for fairer recognition [1.0]
私たちはこのバイアスを2つのデータセット、The Dollar StreetデータセットとImageNetに定量的に提示します。そして、このバイアスを減らすために様々な方法を提示します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:12:10 GMT)
Local operator quench induced by two-dimensional inhomogeneous and homogeneous CFT Hamiltonians [0.9]
等角体理論(2d CFTs)における非平衡過程は、不均一および等質ハミルトニアンによって誘導される作用素の成長によるものである。我々の主な発見は、ホログラフ CFT において、不均一ハミルトニアンによって誘導される非単元時間進化は、単元時間進化よりも長い状態情報を保持することができるということである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:34:49 GMT)
Time Series Analysis in Compressor-Based Machines: A Survey [0.9]
圧縮機ベースの機械は、生産と消費者のニーズを満たすのに不可欠である。本研究の目的は、FD、FP、予測、CPDといったタスクに関する最近の研究を調査することである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:26:01 GMT)
Short vs. Long-term Coordination of Drones: When Distributed Optimization Meets Deep Reinforcement Learning [0.9]
自律型対話型ドローンの群れは、スマートシティーに魅力的なセンシング機能を提供する。本稿では,コスト効率の高いナビゲーション,センシング,リチャージのための新しいコーディネートソリューションの提供を目的とする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:35:12 GMT)
GINopic: Topic Modeling with Graph Isomorphism Network [0.9]
本稿では,グラフ同型ネットワークに基づく話題モデリングフレームワークGINopicを紹介し,単語間の相関関係を捉える。本稿では,既存のトピックモデルと比較してGINopicの有効性を実証し,トピックモデリングの進歩の可能性を明らかにする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:18:48 GMT)
Leveraging YOLO-World and GPT-4V LMMs for Zero-Shot Person Detection and Action Recognition in Drone Imagery [0.8]
本稿では、ドローンの認識領域におけるゼロショット大型マルチモーダルモデル(LMM)の可能性について考察する。我々は、人物検出と行動認識タスクに着目し、ヨロワールドとGPT-4V(ision)という2つの顕著なLMMを評価する。 GPT-4Vは、アクションクラスを正確に分類するのに苦労するが、望ましくない領域の提案をフィルタリングする有望な結果をもたらす。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:07:00 GMT)
Flexible filtrations for multiparameter persistent homology detect digital images [0.8]
トポロジカルデータ解析の分野における2つの重要な問題は、オブジェクト上の実用的なマルチフィルタを定義し、TDAの幾何学的検出能力を示すことである。その結果,Multi-GENEO,Multi-DGENEO,Mix-GENEOの3種類のマルチフィルタが得られた。 MNISTデータセットを用いて,ディジタル画像の幾何学的および位相的差異を検出する能力を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:56:28 GMT)
Self-Organized Agents: A LLM Multi-Agent Framework toward Ultra Large-Scale Code Generation and Optimization [0.8]
自己組織化マルチエージェントフレームワーク(SoA)は、大規模コードのスケーラブルで効率的な生成と最適化を可能にする新しいマルチエージェントフレームワークである。私たちのフレームワークの主な特徴は、問題複雑性に基づいたエージェントの自動乗算であり、動的スケーラビリティを可能にします。我々は、HumanEvalベンチマーク上でSoAを評価し、シングルエージェントシステムと比較して、SoA内の各エージェントがコード処理をかなり少なくするが、全体的なコード生成量は大幅に大きいことを示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:37:28 GMT)
Deterministic Search on Complete Bipartite Graphs by Continuous Time Quantum Walk [0.8]
本稿では,完全二部グラフ上の決定論的探索アルゴリズムを提案する。複数のマーク状態の最も一般的なケースに対処するため、マーク状態の数を推定する問題が存在する。応用として,完全二部グラフ上での完全状態移動問題について検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:09:33 GMT)
ContrastCAD: Contrastive Learning-based Representation Learning for Computer-Aided Design Models [0.7]
本稿では,ContrastCAD という,CAD モデルを学習するための対照的な学習手法を提案する。コントラストCADはCADモデルの構成シーケンス内の意味情報を効果的にキャプチャする。また,RRE法(Random Replace and Extrude)と呼ばれる新しいCADデータ拡張手法を提案し,モデルの学習性能を向上させる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:30:39 GMT)
COVID-19 Detection Based on Blood Test Parameters using Various Artificial Intelligence Methods [0.7]
2019年には、新型コロナウイルスによる新型コロナウイルス感染症SARS-CoV-2(SARS-CoV-2)という新たな課題に直面した。本研究は、自己分類分類器を用いて、さまざまなAI手法を用いて、新型コロナウイルス患者と他者とを区別することを目的とした。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:49:25 GMT)
Global Mapping of Exposure and Physical Vulnerability Dynamics in Least Developed Countries using Remote Sensing and Machine Learning [0.7]
本研究の目的は,気候・災害リスクの低減に向けた長期的集団的取り組みを報知する上で,大規模リスク定量化の分野を推し進めることである。本稿では,現在公開されているSentinel-1 SAR GRDとSentinel-2 Harmonized MSIから,機械学習と時系列リモートセンシングを用いて,この重要な情報をマッピングする作業を行っている。我々は,ほとんど開発されていない(LDC)47か国からなる「OpenSendaiBench」の開発を紹介し,ResNet-50ディープラーニングモデルを訓練し,バングラデシュのダッカ地方を実演した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:04:56 GMT)
BioImage.IO Chatbot: A Community-Driven AI Assistant for Advanced Bioimage Analysis and Tool Integration [0.7]
Bio$Image.$IOは、Large Language Modelsによって支えられ、コミュニティ主導の知識ベースとツールによって強化されたAIアシスタントである。データ検索からAI強化分析に至るまで、フレキシブルな拡張メカニズムを通じて、ユーザ要求の範囲でカスタマイズされたインタラクションを容易にする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:48:39 GMT)
Improved Quantum Query Complexity on Easier Inputs [0.7]
改良されたスパンプログラムアルゴリズムを用いて,事前の約束なしに改善を継続することを示す。応用として、いくつかの探索問題に対する平均クエリ複雑性における指数的および超ポリノミカル量子上の優位性を証明した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:05:59 GMT)
Passive and Deterministic Controlled-phase Gate for Single-photon Wavepackets Based on Time-reversal Symmetric Photon Transport [0.7]
単光子ウェーブパケットに対する受動的,決定論的,ほぼ一元整合性制御-$pi$相ゲートの構築について報告する。提案されたゲートは、時間反転対称光子輸送の原理に根ざしている。非線形媒体を用いたフォトニック位相ゲートに固有のウェーブパレット歪みの長年の問題を回避することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:50:40 GMT)
Breaking the Silence Detecting and Mitigating Gendered Abuse in Hindi, Tamil, and Indian English Online Spaces [0.7]
チームCNLP-NITS-PPは、CNNとBiLSTMネットワークを組み合わせたアンサンブルアプローチを開発した。 CNNは、組み込み入力テキストに適用される畳み込みフィルタを通じて、乱用言語を表す局所的な特徴をキャプチャする。 BiLSTMは、単語とフレーズ間の依存関係について、このシーケンスを解析する。評価スコアはf1尺度、特に英語0.84に対して高い性能を示した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:55:47 GMT)
Leveraging Recommender Systems to Reduce Content Gaps on Peer Production Platforms [0.6]
提案する記事の提示は,記事に対する作業の割合を増大させるが,全体としてのレコメンデーションの取り込みは著しく減少する。論文発見プロセスの無視が、ピアプロダクションプラットフォームにおける推奨事項を人工的に限定することを含む、結果の意味について論じる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:56:53 GMT)
Solving the $KP$ problem with the Global Cartan Decomposition [0.6]
本稿では,Frakp$ で $-iH(t) を制御したターゲット $-iX in [frakp,frakp] サブセット frakk$ の時間最適ユニタリを生成する新しい手法を提案する。 dTheta$の仮定は、変動的手法を用いて解析的に解ける時間最適ユニタリ制御問題と等価であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:03:16 GMT)
Computational limits to the legibility of the imaged human brain [0.5]
構造的および機能的データから25個の生物特性の予測可能性を評価する。性別の高い予測可能性(精度99.7%)、年齢(平均絶対誤差2.048年、R2 0.859)、体重(平均絶対誤差2.609Kg、R225)は、新しい最先端性能と、他の特性の驚くほど低い予測可能性との間に相違があることを見出した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:12:46 GMT)
Making Privacy-preserving Federated Graph Analytics with Strong Guarantees Practical (for Certain Queries) [0.5]
本稿では、ネットワーク転送において、数分の時間とわずかなMIBを必要とするプライバシー保護グラフ分析システムについて、低コストで提案する。 Coloの実装と評価により、人口100万のデバイス上でさまざまなCOVID-19クエリを実行するには、デバイスのCPU時間8.4分未満、ネットワーク転送では4.93 MiBsが必要であることが示されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:01:31 GMT)
MAgNET: A Graph U-Net Architecture for Mesh-Based Simulations [0.5]
我々は、任意のグラフ構造化データに対応するために、よく知られた畳み込みニューラルネットワークを拡張するMagNETを提案する。固体の力学における非線形有限要素シミュレーションのサロゲートモデリングにおけるMAgNETの予測能力を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:22:26 GMT)
Federated Multi-Agent Mapping for Planetary Exploration [0.4]
フェデレートラーニング(FL)は、コラボレーティブラーニングにおける分散型データの課題に対処する、分散マッピングのための有望なアプローチである。我々のアプローチは暗黙的なニューラルマッピングを利用し、コンパクトで適応可能な表現のために、ニューラルネットワークによって学習された連続関数としてマップを表現します。マルチエージェント探索シナリオにおける実環境展開の有効性を実証し,本手法を厳格に評価する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:32:32 GMT)
Multitask-based Evaluation of Open-Source LLM on Software Vulnerability [0.4]
本稿では,公開データセットを用いた対話型LCMの定量的評価パイプラインを提案する。我々は,4つの共通ソフトウェア脆弱性タスクをカバーするBig-Vulを用いて,LLMの広範な技術的評価を行う。既存の最先端手法は、ソフトウェア脆弱性検出において、LLMよりも一般的に優れていることが判明した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:52:05 GMT)
Generalizable, Fast, and Accurate DeepQSPR with fastprop Part 1: Framework and Benchmarks [0.4]
本稿では,DeepQSPRフレームワークであるFastpropを紹介した。このフレームワークは,分子レベル記述子のコジェントなセットを用いて,多様なデータセット上での学習表現の性能を劇的に向上させる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:57:32 GMT)
Classifying Cancer Stage with Open-Source Clinical Large Language Models [0.4]
オープンソースの臨床大言語モデル(LLMs)は、実世界の病理報告から病理組織学的腫瘍-リンパ節転移(pTNM)のステージング情報を抽出することができる。以上より, LLMは腫瘍 (T) 分類においてサブパーパフォーマンスを示すが, プロンプト戦略の適切な適用により, 転移 (M) では同等の性能を示し, Node (N) 分類では性能が向上することが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:30:47 GMT)
What Blocks My Blockchain's Throughput? Developing a Generalizable Approach for Identifying Bottlenecks in Permissioned Blockchains [0.3]
許可されたブロックチェーンのボトルネックを特定するための、より統一的でグラフィカルなアプローチを開発しています。 Hyperledger FabricとQuorumという2つの広く使用されているパーミッションブロックチェーンについて、詳細なケーススタディを実施しています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:00:50 GMT)
Smooth Deep Saliency [0.3]
本稿では,畳み込みダウンサンプリングによる深度分布マップのノイズ低減手法について検討する。これらの手法により,隠れ層で計算した勾配に基づく塩分濃度マップをより解釈しやすくする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:15:43 GMT)
Immature Green Apple Detection and Sizing in Commercial Orchards using YOLOv8 and Shape Fitting Techniques [0.3]
本研究は,3次元点雲データ上の幾何形状整合技術と合わせて,最先端のYOLOv8オブジェクト検出とインスタンス分割アルゴリズムを用いた。この手法は2つのRGB-Dセンサー、Intel RealSense D435iとMicrosoft Azure Kinect DKを利用した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:35:46 GMT)
Probing Off-diagonal Eigenstate Thermalization with Tensor Networks [0.3]
量子シミュレーションと組み合わせたエネルギーフィルタ法は、量子多体系の特性に効率的にアクセスすることができる。我々はこの戦略を拡張して、エネルギー固有基底における可観測物の外対角行列要素の性質を探求する。我々は、最大60個のサイトからなる積分可能で非可積分なスピン鎖について、正確な対角化でアクセス可能なものよりもはるかに大きい方法を試した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:53:49 GMT)
Towards Better Understanding of Cybercrime: The Role of Fine-Tuned LLMs in Translation [0.3]
我々は,サイバー犯罪言語のニュアンスを正確に捉えることができる翻訳を生成するために,細調整のLarge Language Models (LLM) を提案する。我々は,ロシア語を話すハクティビストグループNoName05716の公開チャットに適用する。提案手法は, 高忠実度翻訳が可能であり, 翻訳者に比べて430～23,000のコスト削減が可能であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:33:23 GMT)
Improving and Evaluating Machine Learning Methods for Forensic Shoeprint Matching [0.3]
法医学的な靴紋パターンマッチングのための機械学習パイプラインを提案する。エッジ検出による2次元画像から2次元座標を抽出し, 反復的最近点(ICP)と整列する。次に、類似度指標を抽出し、2つの印刷物がどれだけうまく一致しているかを定量化し、これらの指標を用いてランダムな森林を訓練する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:24:25 GMT)
A Lightweight Security Solution for Mitigation of Hatchetman Attack in RPL-based 6LoWPAN [0.2]
IoT(Internet of Things, モノのインターネット)は業界で大きく成長し、業界 4.0 の時代を生きている。従来のルーティング手法は、限られたリソースデバイス、損失のあるリンク、遅いデータレートを持つネットワークでは効果がない。本稿では、攻撃者が低電力・ロッシーネットワークのためのルーティングプロトコル(RPL)の非ストレージ機能を利用する場合、ネットワーク性能の大幅な低下を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:48:33 GMT)
Symmetry Resolution in non-Lorentzian Field Theories [0.2]
特に、先行順序項、対数項、$mathcalO(1)$項を計算する。キャロル極限に対するSREEのホログラフィック原点を念頭に置いて、BMS$_3$-Kac-Moody に対するSREEをさらに計算する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:01:05 GMT)
Moodle Usability Assessment Methodology using the Universal Design for Learning perspective [0.2]
本研究の目的は,ユニバーサル・デザイン・フォー・ラーニングの原則に基づいて,Moodleプラットフォームのユーザビリティを評価する手法を設計することである。我々は、それぞれのMoodle v.2.xとv.3.xファミリーのバージョンの2つのインスタンスを評価するユースケースの結果を提供する。我々は、国際アクセシビリティ標準に準拠するために、プラットフォームがいくつかの重要な要素を改善しなければならないと結論付けている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:25:51 GMT)
Efficient, indistinguishable telecom C-band photons using a tapered nanobeam [0.2]
InAs/InP量子ドットをテープ状ナノビームに結合した電気通信Cバンドに効率よくファイバカップリングした単一光子源を実演する。この研究は、明るく、純粋で、識別不能な光子を放出する通信用Cバンド単光子源の開発に向けた重要なステップである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:56:33 GMT)
Towards a Completeness Argumentation for Scenario Concepts [0.2]
本稿では,目標構造表記を用いたシナリオ概念の完全性について論じる。シナリオの概念とinDデータセットにメソッドを適用して、ユーザビリティを証明する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:29:38 GMT)
Bayesian neural networks via MCMC: a Python-based tutorial [0.2]
変分推論とマルコフ連鎖モンテカルロサンプリング法を用いてベイズ推定を行う。このチュートリアルはPythonのコードに、その使用と拡張を可能にするデータとインストラクションを提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:38:25 GMT)
Remote sensing framework for geological mapping via stacked autoencoders and clustering [0.2]
地形単位のマッピングのための次元縮小とk平均クラスタリングのために積み重ねられたオートエンコーダを用いて、リモートセンシングデータを処理するための教師なし機械学習フレームワークを提案する。本研究により, 岩盤単位を効率的に識別し, 高精度かつ解釈可能な地質図を作成できることが判明した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:15:32 GMT)
Artificial Intelligence for the Internal Democracy of Political Parties [0.1]
この記事は、AIが政党内における民主的プロセスの測定と実施を強化することを主張している。形式的パラメータや自己報告データ、調査のようなツールに依存することが多いIDDを測定する従来の方法の限界を特定します。記事は、データプライバシに関する懸念、操作の可能性、テクノロジへの過信の危険性など、IDDのための機械学習の主なリスクについて考察することで、結論付けている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:59:23 GMT)
Zero-shot Safety Prediction for Autonomous Robots with Foundation World Models [0.1]
世界モデルは、コントローラを訓練し、システムの内部のダイナミックモデルを学ぶことによって安全違反を予測するために代理世界を作成する。本稿では,観察を意味的かつ因果的に潜伏した表現に組み込む基礎世界モデルを提案する。これにより、Surrogate dynamicsは、トレーニング不要な大規模言語モデルを活用することで、因果先状態を直接予測できる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:39:26 GMT)
Multi-Agent Reinforcement Learning with Control-Theoretic Safety Guarantees for Dynamic Network Bridging [0.1]
この研究は、マルチエージェント強化学習と制御理論的手法を統合するハイブリッドアプローチを導入し、安全で効率的な分散戦略を確実にする。私たちのコントリビューションには、ミッションの目的を損なうことなく、エージェントの位置を動的に調整して安全状態を維持する新しいセットポイント更新アルゴリズムが含まれています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:30:41 GMT)
Ab-initio tree-tensor-network digital twin for quantum computer benchmarking in 2D [0.1]
ノイズ中間スケール量子(NISQ)コンピュータのハミルトン力学の大規模数値シミュレーションは、特定のハードウェアに量子アルゴリズムをチューニングする戦略を開発する上で大きな役割を果たす可能性がある。我々は、リドベルク原子間のファンデルワールス相互作用によって誘導されるゲートクロストークの効果を定量化する。約700ゲートの64ビットグリーンバーガー・ホーネ・ザイリンガー状態(GHZ)の調製により、クローズドシステムでは99.9%の忠実度が得られ、並列化により35%のスピードアップが達成される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:12:07 GMT)
Fusing Pretrained ViTs with TCNet for Enhanced EEG Regression [0.1]
本稿では、脳波回帰の精度を高めるために、事前訓練された視覚変換器(ViT)と時間畳み込みネットワーク(TCNet)の統合について詳述する。以上の結果から, 回転平均角誤差(RMSE)を55.4から51.8に低減した。性能を犠牲にすることなく、このモデルの速度を桁違いに向上させる(最大4.32倍高速)。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:01:51 GMT)
XLB: A differentiable massively parallel lattice Boltzmann library in Python [0.0]
JAX プラットフォームをベースとした Python ベースの差別化可能な LBM ライブラリである XLB ライブラリを紹介する。 XLBの差別化性とデータ構造は、広範囲にわたるJAXベースの機械学習エコシステムと互換性がある。 XLBは数十億のセルでのシミュレーション処理に成功し、毎秒ギガスケールの格子更新を実現している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:56:38 GMT)
Why is the universe not frozen by the quantum Zeno effect? [0.0]
本研究では,2レベルシステムの自由内部進化と周囲環境によるデコヒーレンスとのユビキタスな競合をシミュレートするモデルを構築した。これにより、短時間のデコヒーレンスレベルによって分析的基準が導かれ、ゼノ効果によりシステムが凍結するかどうかが決定される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:00:19 GMT)
When does Subagging Work? [0.0]
回帰木に対するサブアグリゲーションまたはサブスタンプアグリゲーションの有効性について検討した。 i) バイアスは細胞の直径に依存するので、分裂が少ない木はバイアスを受ける傾向にあると定式化します。サブゲージの性能を,異なる数の分割木と比較した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:44:55 GMT)
When Abel Kills Cain: What Machine Translation Cannot Capture [0.0]
記事は、構造の観点から、AIベースの自動翻訳装置が完全に捕捉できないものを特定することを目的としている。原因を説明するために、機械のミスに焦点を当てる。カインとアベルの聖書の物語は、その豊かで批判的な解釈の伝統のために選ばれた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:46:00 GMT)
What is to be gained by ensemble models in analysis of spectroscopic data? [0.0]
分光データの予測を改善することを目的としたアンサンブルモデルの異なる実装を比較するための実験的検討を行った。線形混合モデルを用いた統計的解析は、データのランダムな分割に対するモデル適合から得られる予測性能基準に基づいて行われた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:28:59 GMT)
Using Large Language Models for (De-)Formalization and Natural Argumentation Exercises for Beginner's Students [0.0]
現在開発中の2つのシステムは、自然言語と命題論理と一階述語論理の言語を相互に翻訳する際の(i)エクササイズの自動修正に大規模な言語モデルを使用している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:34:15 GMT)
Upsample Guidance: Scale Up Diffusion Models without Training [0.0]
事前学習した拡散モデルを適用して高解像度画像を生成する手法であるアップサンプルガイダンスを導入する。注目すべきは、このテクニックは追加のトレーニングや外部モデルへの依存を必要としないことだ。アップサンプルガイダンスは,画素空間,潜時空間,ビデオ拡散モデルなど,様々なモデルに適用可能であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 07:49:08 GMT)
Unifying Finite-Temperature Dynamical and Excited-State Quantum Phase Transitions [0.0]
我々は励起状態量子相転移(ESQPT)と2種類の動的相転移(DPT)の直接接続を確立する。我々の研究は、非基底的臨界の様々な概念が密接に結びついており、遠方均衡の統一的な枠組みへの道を開くものである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:35:01 GMT)
Tunneling time, the barrier time-delay and weak measurement What was or can actually be measured with the Attoclock? [0.0]
断熱型トンネル電離の時間遅れと非断熱型トンネル電離の時間遅れの差から,バリアの時間遅れを合理的に定義し,決定できることを示す。弱い測定限界では、バリアの時間遅延はラーモア時計時間とバリア内の相互作用時間に対応する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:45:11 GMT)
Transformer meets wcDTW to improve real-time battery bids: A new approach to scenario selection [0.0]
本稿では,重み付き制約付き動的時間ワープを用いたトランスフォーマーに基づく予測手法を提案する。提案手法はトランスフォーマーの予測能力を利用してエネルギー価格を予測し,wcDTWは関連する歴史的シナリオの選択を保証する。提案手法は従来の方法に比べて10%の収益増加を示し,リアルタイム市場におけるバッテリ入札戦略に革命をもたらす可能性を強調した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:30:54 GMT)
Transcribing Bengali Text with Regional Dialects to IPA using District Guided Tokens [0.0]
本稿では,バングラデシュの6つの地区にまたがる新しいデータセットについて,DGT(District Guided Tokens)技術を紹介する。 DGTテクニックは、この新しいデータセットに基づいて、いくつかのトランスフォーマーベースのモデルを微調整する。 ByT5モデルを用いたDGTの有効性を示す実験結果が得られた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:15:36 GMT)
Towards Enhanced Analysis of Lung Cancer Lesions in EBUS-TBNA -- A Semi-Supervised Video Object Detection Method [0.0]
本研究は気管支内視鏡内視鏡(EBUS)を用いた肺病変診断システムの構築を目的とする。 EBUS-TBNA (EBUS-transbronchial needle aspiration) 術中、医師は病変の位置をグレースケールの超音波画像に頼っている。これまでの研究では、EBUS-TBNAへのオブジェクト検出モデルの適用が欠けており、EBUS-TBNAデータセットに注釈をつけるための明確な解決策は存在していない。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:23:21 GMT)
Time-dependent Rabi frequencies to protect quantum operations on an atomic qutrit by continuous dynamical decoupling [0.0]
本研究では,原子クォートリット上の量子ゲートの作用を保護できるプロシージャに係わる時間依存ラビ周波数に必要な形状について検討する。いくつかのシミュレーションは、ランダムに選択されたものを含む量子ゲートモデルの作用を保護すると考えられている。本稿では,3要素の置換のパリティを識別できるアルゴリズムの適用をノイズから保護するために,本手法を適用した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:43:36 GMT)
Theory of Multimode Squeezed Light Generation in Lossy Media [0.0]
損失媒体で発生する多重モード励起光の特性を記述するための統一的理論的アプローチを示す。ガウス状態の重要なクラスについて、2階相関関数のマスター方程式を導出する。ブロードバンドモードを導入するための様々な技術や戦略を考えることができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:16:29 GMT)
The use of the open innovation paradigm in the public sector: a systematic review of published studies [0.0]
オープンなイノベーションパラダイムの使用は、ここ数年、公共セクターで特に注目を集めてきた。このパラダイムの使用が2013年以降,高い頻度で報告されるようになったことは確認できた。また、ソーシャルメディアによるオープンイノベーションの利用が、公共セクターと市民の間のエンゲージメントの先駆的手法の1つであることも確認できた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:33:34 GMT)
The Ballmer Peak: An Empirical Search [0.0]
Ballmer Peak」の概念は2007年に初めて提案され、超人的プログラミング能力を示す非常に特殊な血液アルコール含量が存在すると仮定した。コーディング能力評価のための業界標準を用いて,このようなピークを探索し,アルコールの量の違いがパフォーマンスに与える影響を概観した。 p 0.001では、少量のアルコール(わずか2杯)がプログラミング能力に有意な効果があることが判明した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:16:23 GMT)
Synthetic Data for Robust Stroke Segmentation [0.0]
ディープラーニングに基づくニューロイメージングにおけるセマンティックセグメンテーションは、現在、高解像度スキャンと広範な注釈付きデータセットを必要とする。そこで我々は,既存のSynthSegアプローチの能力を拡張した,病変分割作業のための新しい合成フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:42:29 GMT)
Supervised Autoencoder MLP for Financial Time Series Forecasting [0.0]
この調査は2010年1月1日から2022年4月30日までの取引資産としてS&P500指数、EUR/USD、BTC/USDに焦点を当てている。具体的には、シャープとインフォメーション比を用いて、ノイズ増大と三重障壁ラベルがリスク調整されたリターンに与える影響を具体的に調べる。その結果、教師付きオートエンコーダは、バランスの取れたノイズ増大とボトルネックサイズにより、戦略の有効性を著しく向上させることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:44:37 GMT)
Study on quantum thermalization from thermal initial states in a superconducting quantum computer [0.0]
本稿では,量子物理学における熱状態の生成問題に対処する手法を提案する。我々は、IBM量子デバイスを用いたアプローチを実験的に検証し、IBM量子ビットの予測どおり、クエンチの非使用緩和結果を提供する。この実験は、量子物理学における熱状態と熱化の研究を合理化できることを示すものである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:59:50 GMT)
Spread complexity for measurement-induced non-unitary dynamics and Zeno effect [0.0]
拡散複雑性と拡散エントロピーを用いた非単位量子力学の研究を行う。非エルミート的ハミルトニアンに対しては、クリロフ基底のビランツォス構成をシュリンガー図形に拡張する。複素対称ハミルトニアンに適応したアルゴリズムを実装した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:00:27 GMT)
Spectral stability of V2 centres in sub-micron 4H-SiC membranes [0.0]
炭化ケイ素のカラーセンターは、有望な半導体量子技術プラットフォームとして出現する。シリコン空孔中心は, サブミクロンシリコン炭化物膜に統合できることが示されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:58:00 GMT)
Sharp bounds for max-sliced Wasserstein distances [0.0]
我々は、分離可能なヒルベルト空間上の確率測度と、$n$サンプルからの経験的分布との予想最大1-ワッサーシュタイン距離の上限と下限を一致させる。また、ユークリッド空間上の対称確率測度$mu$の間の予想最大2-ワッサーシュタイン距離に対して、対数係数まで鋭い上限を得る。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:56:01 GMT)
Selected Open Problems in Continuous-Time Quantum Walks [0.0]
量子ウォーキングは量子コンピューティングの基本である。この記事では、この領域におけるオープンな問題の3つの重要なクラスを取り上げます。我々の目標は、この急速に発展する分野におけるさらなる研究と探索を奨励することである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:46:17 GMT)
Samplet basis pursuit: Multiresolution scattered data approximation with sparsity constraints [0.0]
我々は,$ell_1$-regularization を用いたサンプルト座標における分散データ近似について検討する。 Riesz isometry を用いて、標本を再現されたカーネルヒルベルト空間に埋め込む。組込みサンプルベースに対してスパースな信号のクラスは、カーネル翻訳の基盤に関してスパースな信号のクラスよりもかなり大きいと論じる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:40:16 GMT)
Risks from Language Models for Automated Mental Healthcare: Ethics and Structure for Implementation [0.0]
本稿では、自律性のレベルを規定し、倫理的要件を概説し、AIエージェントに最適なデフォルト動作を定義する構造化フレームワークを提案する。また、16のメンタルヘルス関連質問を用いた10の最先端言語モデルの評価を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:05:06 GMT)
ResNet with Integrated Convolutional Block Attention Module for Ship Classification Using Transfer Learning on Optical Satellite Imagery [0.0]
本研究では,高分解能光リモートセンシング衛星画像を用いた船舶の効率的な分類のための新しい移動学習フレームワークを提案する。このフレームワークは深層畳み込みニューラルネットワークモデルResNet50をベースにしており、CBAM(Convolutional Block Attention Module)を組み込んでパフォーマンスを向上させる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:48:46 GMT)
Real-time Impurity Solver Using Grassmann Time-Evolving Matrix Product Operators [0.0]
本稿では,最近提案されたグラスマン時間進化行列積演算子法に基づく平衡不純物スペクトル関数の計算手法を提案する。この手法の精度は、単軌道アンダーソン不純物モデルで示され、連続時間量子モンテカルロ法に対してベンチマークされる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:36:46 GMT)
Reaching Curzon-Ahlborn limit in linear response and Whitney limit in nonlinear response in edge mode quantum thermoelectrics and refrigeration [0.0]
最大出力での効率は、QHとQSHの両方のセットアップにおいてカーゾン=アルボーン限界に近づいた。線形および非線形輸送系における熱電効率の限界は、量子点接触により初めて達成される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:23:34 GMT)
RAVE: Residual Vector Embedding for CLIP-Guided Backlit Image Enhancement [0.0]
本稿では,教師なしバックライト画像強調作業におけるCLIP指導の新たな修正を提案する。この手法は,CLIP埋め込み空間内のプロンプト(負・正のサンプル)と対応する画像(バックライト画像/ウェルリット画像)とのテキストイメージの類似性を制約することにより,プロンプトペアを学習する。テキスト埋め込みの空間でプロンプトをチューニングする代わりに、品質を損なうことなく、埋め込みを直接調整できることが示される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:28:40 GMT)
Quantum bistability at the interplay between collective and individual decay [0.0]
キャビティ内に置かれた原子集合体の集団放射について検討した。これらの状態の1つは絡み合っていて、コヒーレントに放射されるスピン状態とよく似ている。注目すべきは、この系が個々の崩壊を関連づけた状態でも、絡み合ったCRSSのような状態にあることを示唆している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:44:45 GMT)
Propensity Score Alignment of Unpaired Multimodal Data [0.0]
マルチモーダル表現学習技術は通常、共通の表現を学ぶためにペア化されたサンプルに依存する。本稿では,マルチモーダル表現学習において,異なるモダリティにまたがるアンペア化サンプルの整列化という課題に対処するアプローチを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:36:21 GMT)
Preuve de concept d'un bot vocal dialoguant en wolof [0.0]
本稿では,Wolof言語で構築された最初の自動音声アシスタントのコンセプト実証について述べる。ボイスボットの目的は、オレンジセネガルのサルガル忠誠プログラムに関する情報を提供することである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:53:41 GMT)
Postprocessing of point predictions for probabilistic forecasting of electricity prices: Diversity matters [0.0]
本稿では,3つのポストプロセッシング手法を用いて,点予測を確率的に変換する手法について検討する。その結果,予測分布と他の2つの手法を組み合わせることで,約7.5%の改善が得られた。注目すべきは、この組み合わせのパフォーマンスが、最先端の分散ディープニューラルネットワークと同等であることだ。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:50:36 GMT)
Physics-Informed Graph Neural Network for Dynamic Reconfiguration of Power Systems [0.0]
動的再構成(DyR)は信頼性のあるグリッドを維持するための問題である。 DyRは混合整数問題であり、大きなグリッドや高速な時間スケールで解くことができる。 DyRに適した物理インフォームドグラフニューラルネットワーク(GNN)フレームワークであるGraPhyRを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:44:34 GMT)
Photonic quantum walk with ultrafast time-bin encoding [0.0]
超高速な時間ビン符号化方式を用いて量子ウォークを行う新しいプラットフォームを提案する。このプラットフォームは、多くのステップに量子ウォークのスケーラビリティをサポートしながら、かなりのプログラム可能性を維持している。我々の18段階QWは50時間にわたって干渉位相安定性を保っている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:49:16 GMT)
Pairwise Similarity Distribution Clustering for Noisy Label Learning [0.0]
ノイズラベル学習は、ノイズラベルを持つ大量のサンプルを使用してディープニューラルネットワークをトレーニングすることを目的としている。トレーニングサンプルを1つのクリーンなセットと別のノイズのあるセットに分割する,単純で効果的なサンプル選択アルゴリズムを提案する。 CIFAR-10、CIFAR-100、Clothing1Mといった様々なベンチマークデータセットの実験結果は、最先端の手法よりも大幅に改善されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:30:22 GMT)
On Stronger Computational Separations Between Multimodal and Unimodal Machine Learning [0.0]
マルチモーダル機械学習は、大規模な経験的成功(例えば、GPT-4)を享受した本稿では,マルチモーダル学習理論モデルと一助学習理論モデルとの分離の可能性を検討する。自然条件下では、任意の計算分離が対応する暗号鍵合意プロトコルを意味することを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:21:28 GMT)
OFMPNet: Deep End-to-End Model for Occupancy and Flow Prediction in Urban Environment [0.0]
環境中の全ての動的オブジェクトの将来の挙動を予測するために,エンド・ツー・エンドのニューラルネットワーク手法を提案する。本稿では, 終点誤差の大幅な低減を図った新しい時間重み付きモーションフロー損失を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:37:58 GMT)
Normal weak eigenstate thermalization [0.0]
固有状態の熱化は、様々な非可積分相互作用モデルにおいて、少数の観測可能な天体に対して起こることが示されている。対角行列要素の消滅的分散を示すために保証される非消滅的ヒルベルト・シュミットノルムを持つほとんど体の可観測性が存在することを示す。量子カオス二次ハミルトニアンにとって、正常な弱固有状態熱化は単一粒子固有状態熱化の結果であることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:00:02 GMT)
Noisy atomic magnetometry with Kalman filtering and measurement-based feedback [0.0]
本稿では,測定,推定,制御戦略を統合する総合的なアプローチを提案する。これは原子アンサンブルの連続的な光伝搬に基づく量子的非劣化測定を実装することを含む。提案したフィードバックにより、測定データが破棄された場合でも原子は絡み合いを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:43:47 GMT)
Neural Embedding Compression For Efficient Multi-Task Earth Observation Modelling [0.0]
本稿では,生データではなく,データコンシューマへの圧縮埋め込みの転送に基づくNeural Embedding Compression(NEC)を提案する。我々は、学習したニューラルネットワークを用いて基礎モデル(FM)を適用し、マルチタスク埋め込みを生成する。シーン分類とセマンティックセグメンテーションという2つのEOタスクにおけるNECの評価を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:48:54 GMT)
Near-unity indistinguishability of single photons emitted from dissimilar and independent atomic quantum nodes [0.0]
2つの異なる原子量子ノードから非常に区別できない単一光子を生成することを実証する。 1つのノードは、完全にブロックされたコールドRydbergアンサンブルに基づいており、オンデマンドの単一光子を生成する。時間窓に9,4.6 pm 5.2 % の光子を90% の光子を含む不明瞭性を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:46:45 GMT)
Modular Control Architecture for Safe Marine Navigation: Reinforcement Learning and Predictive Safety Filters [0.0]
強化学習は複雑なシナリオに適応するためにますます使われていますが、安全性と安定性を保証するための標準フレームワークは欠如しています。予測安全フィルタ(PSF)は、明示的な制約処理を伴わずに、学習ベースの制御における制約満足度を確保する、有望なソリューションを提供する。この手法を海洋航法に適用し,シミュレーションされたCybership IIモデル上でRLとPSFを組み合わせた。その結果, PSF が安全維持に有効であることは, RL エージェントの学習速度と性能を損なうことなく示され, PSF を使用せずに標準 RL エージェントに対して評価された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:12:11 GMT)
MedMamba: Vision Mamba for Medical Image Classification [0.0]
医用画像分類のためのビジョンマンバ(メドマンバ)を提案する。新しいConv-SSMモジュールは、畳み込み層の局所的な特徴抽出能力と、長距離依存性をキャプチャするSSMの機能を組み合わせる。私たちの知る限りでは、Vision Mambaは医療画像分類用に作られた最初のVision Mambaだ。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:11:45 GMT)
Long-range correlations of the stress tensor near the Cauchy horizon [0.0]
我々は、Reissner-Nordstr"om-de Sitter 時空上の実スカラー量子場の応力テンソルが、コーシー地平線近傍のマクロ距離に相関していることを示す。これはコーシー地平線付近の半古典近似の分解を示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:33:44 GMT)
Leveraging Machine Learning for Early Autism Detection via INDT-ASD Indian Database [0.0]
自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、世界最速の発達障害の一つである。本研究は,機械学習を用いてASDを識別するための簡易かつ迅速かつ安価な技術を開発することを目的とした。 Adaboost (AB), Gradient Boost (GB), Decision Tree (DT), Logistic Regression (LR), Random Forest (RF), Gaussian Naive Bayes (GNB), Linear Discriminant Analysis (LDA), Quadratic Discriminant Analysis (QDA), K-Nearest Neighbors (KNN), Support Vector Machine (SVM)など,さまざまな機械学習分類器がある。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:44:51 GMT)
LLMs as Writing Assistants: Exploring Perspectives on Sense of Ownership and Reasoning [0.0]
執筆におけるオーナシップの感覚は、思考、時間、貢献の投資を制限し、アウトプットへのアタッチメントにつながります。すべてのタスクが同等であっても、創造的なタスクでは、LLM(Large Language Models)を信用する傾向があります。我々は,これらの問題を調査し,その基礎となる認知過程を理解して,書面における人間とコンピュータの相互作用についてより深い知識を得るための簡単な調査を行う。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:40:21 GMT)
Kallaama: A Transcribed Speech Dataset about Agriculture in the Three Most Widely Spoken Languages in Senegal [0.0]
Kallaamaプロジェクトは、音声技術開発のための国語コーパスの作成と普及を目的としている。プロジェクトはセネガル人の主要言語であるWolof、Pulaar、Sereerの3つに焦点を当てている。上記各言語における農業に関する125時間の記録を含む音声データセットを作成した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:31:14 GMT)
James-Stein Estimation in Gaussian Metrology : V2 [0.0]
ジェームズ・スタイン推定器における量子現象の影響について検討する。ノイズのない絡み合いやコヒーレンスにより,ジェームズ・スタイン推定器の性能が向上することがわかった。ノイズの存在下では、ジェームズ=スタインの利点が復元される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:00:08 GMT)
Investigating Markers and Drivers of Gender Bias in Machine Translations [0.0]
大型言語モデル(LLM)におけるインプシット性バイアスは、文書化された問題である。我々は、DeepL翻訳APIを使用して、56のソフトウェアエンジニアリングタスクを繰り返し翻訳する際に生じるバイアスを調査する。いくつかの言語は、類似した代名詞の使用パターンを示し、3つの緩いグループに分類する。文中に出現する主動詞は,翻訳における意味のあるジェンダーの要因である可能性が示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:07:39 GMT)
Intrusion Tolerance for Networked Systems through Two-Level Feedback Control [0.0]
サービスレプリカを2段階最適制御問題とするシステムの侵入耐性を定式化する。ローカルレベルではノードコントローラが侵入回復を行い、グローバルレベルではシステムコントローラが複製係数を管理する。この定式化に基づいて、侵入耐性システムのための新しい制御アーキテクチャであるTOLERANCEを設計する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:00:45 GMT)
Interplay between the Lyapunov exponents and phase transitions of charged AdS black holes [0.0]
ダイオニクス、バーディーン、ガウス・ボネット、ローレンツ対称性が巨大な重力ブラックホールを破ると考えている。我々は、ブラックホールに近い不安定な円形測地学において、質量を持たない粒子と質量を持つ粒子のリャプノフ指数を計算する。 Lyapunov指数の温度分布は、小さなブラックホール相と大きなブラックホール相で異なる挙動を示すことが判明した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:45:46 GMT)
Ink and Individuality: Crafting a Personalised Narrative in the Age of LLMs [0.0]
LLMベースの筆記アシスタントへの依存が高まると、創造性と個性は時間とともに悪化する。本研究は,様々な視点と概念を探索するための簡単な調査を行うことにより,これらの懸念について検討する。これらの課題に対処することは、人間とコンピュータのインタラクションシステムを改善し、パーソナライズとパーソナライズのためのアシスタントを書くために不可欠である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:42:05 GMT)
Individual-Ion Addressing and Readout in a Penning Trap [0.0]
永久磁石ペニングトラップ内の固回転平面結晶にイオンの個別配置と読み出しを実装した。平行読み出し用回転フレームには、トラップされたイオン蛍光が検出される。結晶の中心付近および大きな半径付近でのイオンのアドレス化を実証した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:03:57 GMT)
Improving the Diproche CNL through Autoformalization via Large Language Models [0.0]
Diprocheシステムは、ドイツ語の制御された断片で書かれたテキストの自動証明チェッカーである。本稿では,Diprocheの文脈において,大規模言語モデルによる自己形式化の促進の可能性について検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:29:58 GMT)
Improved model-free bounds for multi-asset options using option-implied information and deep learning [0.0]
我々は、依存の不確かさと依存構造に関する追加情報を組み合わせた設定において、マルチアセストオプションに対するモデルフリー境界の計算を考察する。この設定における資産価格の基本的な定理と、確率測度よりも問題を変換できる双対性を提供する。後者は、ニューラルネットワークを用いたディープラーニング近似と組み合わせたペナライズ手法を用いて解決される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:37:22 GMT)
How much symmetry do symmetric measurements need for efficient operational applications? [0.0]
情報的完備集合に対しては、正則エルミート作用素基底を用いた構成法を提案する。一般化の過程で失われる対称性の性質のいくつかは、すべてのPOVMに対して同じ数の要素を固定することなく回復することができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:23:08 GMT)
Horoballs and the subgradient method [0.0]
我々は、アダマール空間上の凸最適化を、下次アルゴリズムのスタイルで検討する。我々の反復は一般のアダマール空間に適用され、基礎空間自体にフレーム化され、対象のレベル集合の球面凸性に依存する。本稿では,アダマール空間における極小囲み球問題に対する段階的アルゴリズムについて述べる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:11:09 GMT)
Granular Aluminum Parametric Amplifier for Low-Noise Measurements in Tesla Fields [0.0]
2つの結合したGraAl共振器で作られた非縮退増幅器を1Tまでの面内磁場に抵抗する。加算雑音の量子限界に近い20dBのゲインを提供し、ゲイン帯域幅は28MHz、入力飽和電力は-110dBmである。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:12:54 GMT)
Geometric quantum discord of an arbitrary two-qudit state: the exact value and general upper bounds [0.0]
一般の2量子状態に対する幾何量子不協和の明確な正確な解析値を求める。これにより、任意の2量子状態、純粋あるいは混合、幾何学的量子不協和の新たな一般上界を見つけることができる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 08:34:19 GMT)
GUARD-D-LLM: An LLM-Based Risk Assessment Engine for the Downstream uses of LLMs [0.0]
本稿では,大規模言語モデル(LLM)の下流から発生するリスクについて検討する。テキストベースのユーザ入力から派生した特定のユースケースに関連する脅威を特定し、ランク付けする新しいLCMベースのリスクアセスメントエンジン(GUARD-D-LLM)を導入する。 30の知的エージェントを統合することで、この革新的なアプローチは、悪夢のリスクを特定し、その重症度を測定し、緩和のためのターゲットとなる提案を提供し、リスク認識開発を促進する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:25:17 GMT)
Full Counting Statistics of Charge in Quenched Quantum Gases [0.0]
ボースとフェルミの気体を相互作用する1次元の粒子数の完全な数え上げ統計について検討する。初期状態と長時間の電荷のスケールした累積が単に関連していることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:11:10 GMT)
From Seaweed to Security: The Emergence of Alginate in Compromising IoT Fingerprint Sensors [0.0]
茶色の海藻由来のバイオポリマーであるAlginateを,IoT固有の容量型指紋センサをスポーフィングする新しい材料として紹介する。当社の研究では、Alginateと最先端の画像認識技術を使用して、セキュリティとプライバシに関する重大な懸念を提起するニュアンスなIoT脆弱性を明らかにしています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 17:58:24 GMT)
Few-shot point cloud reconstruction and denoising via learned Guassian splats renderings and fine-tuned diffusion features [0.0]
本稿では,少数の画像から点雲を再構成し,そのレンダリングから点雲を識別する手法を提案する。制約条件下での再構成を改善するため,ハイブリッド表面と外観の相違点のトレーニングを規則化する。これらの学習したフィルタを使って、3Dの監督なしに来る点雲ノイズを除去する方法を実証する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:21:38 GMT)
Extreme plasmons [0.0]
極端プラズモンの制御された励起は、前例のないペタボルトを1メートル当たりの場に放出する。この研究は振動振幅を持つ非摂動プラズモンを導入し、特性コヒーレンスの分解によって設定された極限に近づく。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:32:36 GMT)
Exploring How Multiple Levels of GPT-Generated Programming Hints Support or Disappoint Novices [0.0]
本研究は,学生の問題解決と学習を支援するヒントのレベルの違いについて検討した。 LLMヒントファクトリーを用いた12初心者を対象にシンクアップアラウド調査を行った。ハイレベルな自然言語のヒントだけでは役に立たないか、あるいは誤解を招く可能性があることがわかりました。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:05:26 GMT)
Explicit formulas for adiabatic elimination with fast unitary dynamics [0.0]
オープン量子系における高速減衰自由度のいわゆる「断熱除去」は、時間スケール分離における一連の展開によって行うことができる。関連する計算は、残り自由度が単に遅くなるのではなく、高速なユニタリダイナミクスに従う場合、はるかに困難である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:03:33 GMT)
Evaluating Large Language Models Using Contrast Sets: An Experimental Approach [0.0]
本研究では,スタンフォード自然言語推論データセットのコントラストセットを生成する革新的な手法を提案する。我々の戦略は、動詞、副詞、形容詞をその同義語と自動置換して、文の本来の意味を保存することである。本手法は,モデルの性能が真の言語理解に基づくのか,それとも単にパターン認識に基づくのかを評価することを目的とする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 02:03:28 GMT)
Enhancing wind field resolution in complex terrain through a knowledge-driven machine learning approach [0.0]
ニューラルネットワークを用いたモデルでは、局所的な地形を尊重しながら、粗いスケールから完全に解決された3次元速度場を再構築できることが示される。また、ドメイン知識に基づく適切なコスト関数を用いることで、敵のトレーニングの使用を軽減できることを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:24:24 GMT)
Enhancing Inference Efficiency of Large Language Models: Investigating Optimization Strategies and Architectural Innovations [0.0]
この論文はモデル圧縮の手法を探求する。モデル圧縮の有効な方法として,トランスフォーマーLLMにおいて,後続の注意サブレイヤをスキップする簡単な手法を実証的に示す。その結果,Llama 2 7Bでは21%の高速化が見られた。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:53:54 GMT)
Enhancing Formal Theorem Proving: A Comprehensive Dataset for Training AI Models on Coq Code [0.0]
Coqの証明アシスタントは、数学的アサーションとソフトウェアの正確性を検証するための厳格なアプローチで際立っている。人工知能と機械学習の進歩にもかかわらず、Coq構文と意味論の特殊性は大規模言語モデル(LLM)に固有の課題をもたらす。このデータセットは、10,000以上のCoqソースファイルのコレクションから派生したもので、幅広い命題、証明、定義を含んでいる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:54:47 GMT)
EnergAIze: Multi Agent Deep Deterministic Policy Gradient for Vehicle to Grid Energy Management [0.0]
本稿では,MARL(Multi-Agent Reinforcement Learning)エネルギー管理フレームワークであるEnergAIzeを紹介する。ユーザ中心の多目的エネルギー管理を可能にし、各プローサが様々な個人管理目標から選択できるようにする。 EnergAIzeの有効性は、CityLearnシミュレーションフレームワークを用いたケーススタディにより評価された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:16:17 GMT)
End-to-End Demonstration for CubeSatellite Quantum Key Distribution [0.0]
小型ナノサテライトを用いた衛星ベースの量子鍵交換の実現可能性について検討する。本稿では,キューブ衛星シナリオを対象としたシステムレベルの量子鍵分布の最初のプロトタイプを示す。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:43:26 GMT)
Empowering Credit Scoring Systems with Quantum-Enhanced Machine Learning [0.0]
量子カーネルは、量子機械学習にアーリーステージの有用性を提供するために計画されている。古典的なモデルはデータが不足し歪んでしまえば苦労します量子特徴空間は、予測されるデータ特徴とターゲットクラスの間のより良いリンクを見つけるために投影される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 05:54:55 GMT)
Efficient tensor network simulation of IBM's largest quantum processors [0.0]
量子インスパイアされた2dテンソルネットワークがIBMの最大の量子プロセッサを効率的に正確にシミュレートできることを示す。グラフベース射影絡み合ったペア状態(gPEPS)を用いた複素量子多体系の力学をシミュレートする。この結果から,gPEPSは格子ベースの量子ビット接続で量子コンピュータを効率的にシミュレートするための自然なツールであることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:44:04 GMT)
Efficient Implementation of Multi-Controlled Quantum Gates [0.0]
本稿では,最先端手法と比較してコストを大幅に削減できるマルチコントロール量子ゲートの実装について述べる。任意のターゲット量子ビットに対してメソッドを拡張し、追加のアンシラ量子ビットが利用可能であれば、さらなるコスト削減を提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:13:18 GMT)
EV2Gym: A Flexible V2G Simulator for EV Smart Charging Research and Benchmarking [0.0]
本稿では,小型かつ大規模なスマート充電アルゴリズムの開発と評価を目的とした,現実的なシミュレータプラットフォームEV2Gymを紹介する。提案するシミュレータには, 実データを用いた総合的なEV, 充電ステーション, 電力変換器, EV挙動モデルが格納されている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:22:53 GMT)
Dynamics of a quantum system interacting with white non-Gaussian baths: Poisson noise master equation [0.0]
浴槽のポアソンノイズ特性に影響を受ける量子散逸系を記述する理論を考案する。得られたマスター方程式は、ホワイトノイズ状態における非ガウス浴効果を明らかにする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:49:40 GMT)
Duality transformations and the entanglement entropy of gauge theories [0.0]
スピンモデルの観点から二重記述を持つ格子ゲージ理論について検討する。第一部では、ゲージ理論のレプリカ空間の構造を導出し、レプリカ幾何学における双対変換を行う。第2部では、3次元の時空次元におけるZ$ゲージ理論のエントロピーc-函数であるモンテカルロシミュレーションを用いて計算する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:24:51 GMT)
Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification [0.0]
本研究では,乳がんの新たな分類法であるDual-Activated Lightweight Attention ResNet50モデルを提案する。トレーニング済みのResNet50モデルと軽量なアテンション機構を統合し、ResNet50の第4層にアテンションモジュールを埋め込む。 DALAResNet50法は,40X,100X,200X,400Xの乳がん組織像を用いて,それぞれ98.5%,98.7%,97.9%,94.3%の検診を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:14:26 GMT)
Diagonal Coset Approach to Topological Quantum Computation with Fibonacci Anyons [0.0]
本研究では、フィボナッチ・アロンに基づくトポロジカル量子計算のための有望な共形場理論の実現スキームについて検討する。量子ゲートはこれらをブレイディングすることで実現される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:44:02 GMT)
Device Independent Quantum Key Distribution with realistic single-photon source implementations [0.0]
Device Independent Quantum Key Distribution (DIKQD) は、デバイスを信頼せずに、遠隔者間で秘密鍵を生成することを目的としている。本研究では, 単光子源に基づくフルフォトニックDIQKDの提案と, 両者の間に位置する中央駅におけるシーディング測定について検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:25:46 GMT)
Detection of direct path component absence in NLOS UWB channel [0.0]
NLOS(Non-Line-of-Sight)識別技術を提案する。遅延したダイレクトパスコンポーネントが完全にブロックされ、導入されたバイアスがずっと高くなり、緩和するのが難しくなる状況を認識します。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 23:20:57 GMT)
Detecting Gender Bias in Course Evaluations [0.0]
我々は、データを調べ、探索するために異なる方法を使用し、試験者の性別に応じて、学生がコースについて書く内容の違いを見つける。英語とスウェーデンのコースからのデータを評価・比較し、発見されるかもしれない性バイアスのニュアンスをより正確に捉える。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:35:05 GMT)
Demonstration of logical qubits and repeated error correction with better-than-physical error rates [0.0]
我々は,フォールトトレラント符号化と誤り訂正を用いて,物理誤差率以下のレベルまで論理誤差率を抑えることができる,トラップイオンQCCDプロセッサの実験を行った。結果は、ノイズの多い中間スケールの量子コンピューティングから信頼性のある量子コンピューティングへの重要な移行を示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:14:13 GMT)
Deep Neural Networks with 3D Point Clouds for Empirical Friction Measurements in Hydrodynamic Flood Models [0.0]
摩擦係数 (FF) は洪水モデルにおける運動量損失を計算するために用いられる。洪水モデルは、しばしばFFを推定するために代理観測(土地利用など)に依存し、不確実性をもたらす。本研究では,実験室で訓練したDeep Neural Network (DNN) を用いてデータ拡張技術を用いて,Point Cloudデータに基づくManningのnの測定を行った。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:44:53 GMT)
Constrained Optimal Fuel Consumption of HEV: A Constrained Reinforcement Learning Approach [0.0]
この研究は、制約付き強化学習(CRL)の観点から、制約付き最適燃料消費(COFC)の数学的表現を提供する。 CRLの2つの主要なアプローチ、制約付き変動ポリシー最適化(CVPO)とラグランジアンベースのアプローチが、車両の最小燃費を得るために初めて使用される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 11:20:22 GMT)
Consistent treatment of quantum systems with a time-dependent Hilbert space [0.0]
一般に、ハミルトニアン作用素は、それが自己随伴作用素であるとしても、システムの可観測性を表すものではない。これは、演算子値のゲージポテンシャルの存在から生じる量子力学の隠れ幾何学的な側面に関連している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 12:13:56 GMT)
Comparative Study of Domain Driven Terms Extraction Using Large Language Models [0.0]
キーワードは、人間の理解とテキストデータの機械処理のギャップを埋める上で重要な役割を果たす。本稿では,Llama2-7B,GPT-3.5,Falcon-7Bの3つの主要言語モデル (LLM) の利用を強調したキーワード抽出手法について述べる。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 22:04:51 GMT)
Collapse of Self-trained Language Models [0.0]
私たちは、人間が以前の思考や行動に基づいて学習し、構築する方法に似た、自己学習モデルの自分たちのアウトプットでの可能性を探る。 GPT-2モデルの拡張自己学習により,性能が著しく低下し,繰り返しおよび崩壊したトークンが出力されることがわかった。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 21:03:37 GMT)
Classifying Graphemes in English Words Through the Application of a Fuzzy Inference System [0.0]
言語学において、グラテム(グラテム、英: grapheme)とは、音韻音に対応する書記体系の書記単位である。本稿では,単語をグラフに分割するファジィ推論システムを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:47:52 GMT)
Classical analogue of quantum superdense coding and communication advantage of a single quantum system [0.0]
古典的共有ランダム性の助けのないキュービット通信は,その目的を達成することができることを示す。また、対称多角形状態空間によって記述された古典的でない玩具類の通信ユーティリティについても検討する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:40:03 GMT)
Causality-based Transfer of Driving Scenarios to Unseen Intersections [0.0]
シナリオベースのテストでは、自動関数は事前に定義されたシナリオのセットで評価される。現実的なシナリオを作成するには、パラメータとパラメータの依存関係を実際のデータを活用する必要がある。本稿では,シナリオのパラメータ間の関係を体系的に解析する手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:38:18 GMT)
Candidate Incentive Distributions: How voting methods shape electoral incentives [0.0]
Instant Runoff Votingは、Plurality Votingよりも幅広い有権者にアピールするよう、候補者にインセンティブを与える。コンドルチェット法とSTAR (Score Then Automatic Runoff) Votingが最もバランスのとれたインセンティブを提供する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:18:28 GMT)
CARLOS: An Open, Modular, and Scalable Simulation Framework for the Development and Testing of Software for C-ITS [0.0]
CARLOS - C-ITSにおけるソフトウェアの開発とテストのためのオープンでモジュール化されたスケーラブルなシミュレーションフレームワークを提案する。このフレームワークの中核となるビルディングブロックを提供し、コミュニティによってどのように利用され、拡張されるかを説明します。本稿では、重要な設計原則を説明し、3つの主要なユースケースを示すことによって、アーキテクチャのモチベーションを高める。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 10:48:36 GMT)
Brownian Particles and Matter Waves [0.0]
ブラウン粒子が量子デコヒーレンスから先入観を使わずに、粒子-波双対性を示すことができるかどうかを検討する。私たちの1次元の計算では、このトラップは非常に強く、ブラウンナノ粒子を非常に硬い固体に埋め込む必要があることが示されています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:01:14 GMT)
Bridging Language, Vision and Action: Multimodal VAEs in Robotic Manipulation Tasks [0.0]
本研究では,ロボット操作分野における教師なし視覚-言語-アクションマッピングに着目した。本研究では,シミュレータにおけるモデルの性能を最大55%向上させるモデル不変学習法を提案する。我々の研究は、ロボット運動軌跡の教師なし学習に現在のマルチモーダルVAEを使用することの潜在的な利点と限界にも光を当てている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:25:16 GMT)
Breaking the HISCO Barrier: Automatic Occupational Standardization with OccCANINE [0.0]
OccCANINEは、職業的記述をHISCO分類体系に変換する。既存の言語モデル(CANINE)を精査して、これを自動的に実行します。私たちのアプローチは精度、リコール、精度が90%以上であることが示されています。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:56:18 GMT)
Beyond unital noise in variational quantum algorithms: noise-induced barren plateaus and fixed points [0.0]
変分量子アルゴリズム(VQA)は、多くの可能性を秘めているが、指数的に小さな勾配の挑戦に直面している。ノイズ誘起バレン高原(NIBPs)は、開放系効果によって生じる避けられないBPの一種である。本稿では,VQAコスト関数の雑音誘起定点(NIFP)の関連現象を同定し,その存在を一元的および非一元的ノイズマップで証明する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:40:35 GMT)
Bayesian Neural Networks for Macroeconomic Analysis [0.0]
政策機関のマクロ経済分析によく用いられるデータセットを扱うのに適したベイズニューラルネットワーク(BNN)を開発した。本手法は,アクティベーション関数の新規な混合仕様を用いて,広範な仕様検索を回避する。我々のBNNは、通常、他の機械学習手法よりも正確な密度予測を生成する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:17:31 GMT)
BERTopic-Driven Stock Market Predictions: Unraveling Sentiment Insights [0.0]
NLP技術であるBERTopicを用いて、株式市場のコメントから派生したトピックの感情を分析する。本手法は,この感情分析と様々な深層学習モデルを統合し,時系列およびストック予測タスクの有効性で有名である。その結果、株式市場のコメントの話題は、株式市場のボラティリティと価格トレンドに関する暗黙の貴重な洞察を提供することを示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 15:50:10 GMT)
Automatic Wood Pith Detector: Local Orientation Estimation and Robust Accumulation [0.0]
木材ピット検出(APD)のための完全自動化手法を提案する。この方法は、2次元構造テンソルを用いてリングの局所的な向きを推定し、ピット位置を求める。また,明らかなツリーリングパターンが存在しない場合に,本手法の有効性を高める変種(APD-PCL)を提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:47:15 GMT)
Automated User Story Generation with Test Case Specification Using Large Language Model [0.0]
要件文書からユーザストーリーを自動生成するツール「GeneUS」を開発した。アウトプットはフォーマットで提供され、ダウンストリーム統合の可能性は人気のあるプロジェクト管理ツールに開放されます。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 01:45:57 GMT)
Audio Simulation for Sound Source Localization in Virtual Evironment [0.0]
信号遮断環境における非視線局所化は、難しいが関連する問題である。本研究では,物理基底音の伝搬シミュレーションと機械学習手法を利用して,仮想環境内の特定の場所に音源を配置することを目的とする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:18:28 GMT)
Agent-based Modelling of Quantum Prisoner's Dilemma [0.0]
単発量子囚人ジレンマ(QuPD)におけるノイズの存在下での協調の出現を考察する。 5つの指標、すなわちゲーム磁化、絡み合い感受性、相関、プレイヤーのペイオフ平均およびペイオフ能力を考える。我々は,QuPDのtextitQuantum と textitDefect の両相の性質を数値解析し,検討した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 18:08:13 GMT)
Accurate and precise quantum computation of valence two-neutron systems [0.0]
2つの中性子系の基底状態を精度良く正確に計算する量子アルゴリズムを導入する。実量子デバイスを用いた実験では、量子ビットの接続性に配慮した回路レイアウト設計の重要な役割も示している。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:54:13 GMT)
Accelerated quantum circuit Monte-Carlo simulation for heavy quark thermalization [0.0]
我々は、重クォーク熱化をシミュレートするために、加速量子回路モンテカルロフレームワークを導入し、形式化する。アインシュタインの関係で連結された簡易なドラッグと拡散係数により、重クォークの等方性および異方性媒体における熱化をシミュレートする。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:59:11 GMT)
Ab initio extended Hubbard model of short polyenes for efficient quantum computing [0.0]
本稿では,ab initioダウンフォールディング法により導出される拡張ハバード・ハミルトンを導入することを提案する。 ab initio拡張ハバード・ハミルトンは量子コンピュータを用いた量子化学計算において大きな可能性を秘めている可能性がある。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 04:13:09 GMT)
AI Act and Large Language Models (LLMs): When critical issues and privacy impact require human and ethical oversight [0.0]
人間の監視、倫理的監視、プライバシーへの影響評価に対処する。この貢献は、人間の監視、倫理的監視、およびプライバシーへの影響評価に対処する。プライバシー、個人データ保護、倫理レベルで、特に最も弱く最も脆弱な領域において、リスクのレベルとそれらが与える影響を評価する必要があると結論付けている。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 06:05:29 GMT)
A new lightweight additive homomorphic encryption algorithm [0.0]
本稿では、同じ暗号鍵と復号鍵を持つ軽量な加法的同型アルゴリズムについて述べる。これにより、モジュラー指数からモジュラー乗算への暗号化と復号化の計算コストが削減される。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 03:36:37 GMT)
A discussion about violin reduction: geometric analysis of contour lines and channel of minima [0.0]
縮小された楽器と非還元された楽器の差を観察し、特に輪郭線とミニマの流路で観察する。最近の予備研究で、光グラム法により得られた三角形の3Dメッシュを用いて、2つの楽器の2つの特徴を計算し、強調した。ここでは、38のヴァイオリン、ヴァイオラ、チェロのコーパスを拡張し、改良された手順を導入することを提案する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 14:40:11 GMT)
A Quadratic Sample Complexity Reduction for Agnostic Learning via Quantum Algorithms [0.0]
我々は,$O(mboxlog(frac1delta)/epsilon)を$epsilon,deltarightarrow 0arrowとして新しいサンプル複雑性上限を求める。一般学習の場合、学習速度の量子スピードアップは、$epsilon-1$の2乗である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 20:15:41 GMT)
A Post Quantum Key Agreement Protocol Based on a Modified Matrix Power Function over a Rectangular Matrices Semiring [0.0]
Sakalauskas行列パワー関数は共有秘密鍵を生成するための効率的で安全な方法である。そこで我々は,Sakalauskas行列パワー関数鍵契約プロトコルの量子後バージョンを改良した。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 16:45:28 GMT)
A Novel Approach to Reduce Derivative Costs in Variational Quantum Algorithms [0.0]
QNDM(Quantum Non-Demolition Measurement)は、量子可観測体の勾配やヘッセンを効率的に推定する。これは、量子オブザーバブルに関連するコスト関数を最小限にしたい場合、重要なステップであり、リソース要求タスクです。コスト関数の導関数を評価する際に、QNDMアプローチはより効率的である。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 19:06:01 GMT)
A Kerr kernel quantum learning machine [0.0]
超伝導量子回路に基づく量子ハードウェアカーネルの実装手法を提案する。このスキームは量子ビットや量子回路を使用せず、カーモードのアナログ特性を利用する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 09:50:33 GMT)
$(n,m,p)$-type quantum network configuration and its nonlocality [0.0]
遠方ノード間の量子ネットワーク共有絡み線源により、適切な測定により、ネットワークに沿った絡線を分散することができる。ネットワーク非局所性は、独立したソースから出力されるローカル変数を含むネットワークモデルを認めないことを意味する。
論文参考訳（メタデータ） (Tue, 2 Apr 2024 13:54:32 GMT)