Gemini: A Family of Highly Capable Multimodal Models [627.2] マルチモーダルモデルの新たなファミリーであるGeminiは、画像、オーディオ、ビデオ、テキスト理解にまたがる優れた機能を示している。
GeminiファミリーはUltra、Pro、Nanoサイズで構成されており、複雑な推論タスクからオンデバイスメモリ制約のユースケースまで幅広い用途に適している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:35:21 GMT)
Infini-gram: Scaling Unbounded n-gram Language Models to a Trillion Tokens [138.4] 神経大言語モデル(LLM)の時代には,$n$-gramの言語モデルがいまだに関係していることを示す。
これは、2つの側面で$n$-gramのLMを近代化することで実現された。まず、ニューラルネットワークLLMと同じデータスケールでトレーニングする -- 5兆トークン。
次に、既存の$n$-gram LMは、そのパフォーマンスを妨げる小さな$n$を使用します。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:14:53 GMT)
TIP-Editor: An Accurate 3D Editor Following Both Text-Prompts And Image-Prompts [119.8] TIPEditorは、テキストと画像プロンプトの両方を受け入れる3Dシーン編集フレームワークであり、編集領域を指定するための3Dバウンディングボックスである。
TIP-Editorはテキストと画像のプロンプトに従って、指定されたバウンディングボックス領域で正確な編集を行うことを示した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:55:59 GMT)
Advancing LLM Reasoning Generalists with Preference Trees [119.6] 推論に最適化された大規模言語モデル(LLM)のスイートであるEulusを紹介する。
Eurusモデルは、様々なベンチマークでオープンソースのモデルの間で最先端の結果を得る。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:25:30 GMT)
Direct Preference Optimization of Video Large Multimodal Models from Language Model Reward [118.7] 本稿では,映像コンテンツのプロキシとして詳細な動画キャプションを利用する新しいフレームワークを提案する。
本稿では,DPOによる報酬の調整により,ビデオ質問応答(QA)タスクにおけるビデオLMMの性能が著しく向上することを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:47:49 GMT)
Don't throw away your value model! Generating more preferable text with Value-Guided Monte-Carlo Tree Search decoding [104.8] PPO(Proximal Policy Optimization)に基づいて自然言語テキストを生成する場合、推論時探索アルゴリズムは不要に思えるかもしれない
本稿では,モンテカルロ木探索 (MCTS) を統合することで,PPOから余分な距離を得ることが可能であることを実証する。
提案するPPO-MCTSは,PPOから値ネットワークを統合することで,推論時生成時のポリシネットワークと密接に連携する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:51:49 GMT)
Dynamic Pre-training: Towards Efficient and Scalable All-in-One Image Restoration [100.5] オールインワン画像復元は、各分解に対してタスク固有の非ジェネリックモデルを持たずに、統一されたモデルで異なるタイプの劣化に対処する。
我々は、オールインワン画像復元タスクのためのエンコーダデコーダ方式で設計されたネットワークの動的ファミリであるDyNetを提案する。
我々のDyNetは、よりバルク化と軽量化をシームレスに切り替えることができるので、効率的なモデルデプロイメントのための柔軟性を提供します。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:58:49 GMT)
On the steerability of large language models toward data-driven personas [98.9] 大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。
本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:29:52 GMT)
Neuromorphic Split Computing with Wake-Up Radios: Architecture and Design via Digital Twinning [98.0] 本研究は,遠隔・無線接続型NPUからなる分割計算機システムに,覚醒無線機構を組み込んだ新しいアーキテクチャを提案する。
覚醒無線に基づくニューロモルフィックスプリットコンピューティングシステムの設計における重要な課題は、検知、覚醒信号検出、意思決定のためのしきい値の選択である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:19:04 GMT)
Readout Guidance: Learning Control from Diffusion Features [96.2] 本稿では,学習信号を用いたテキスト・画像拡散モデル制御手法であるReadout Guidanceを提案する。
Readout Guidanceはリードアウトヘッドを使用し、トレーニング済みの凍結拡散モデルの特徴から信号を取り出すために訓練された軽量ネットワークである。
これらの読み出しは、ポーズ、深さ、エッジなどのシングルイメージ特性や、対応性や外観類似性といった複数の画像に関連する高次特性を符号化することができる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:12:20 GMT)
ADDP: Learning General Representations for Image Recognition and Generation with Alternating Denoising Diffusion Process [94.4] 本稿では,2つの空間を1つの表現学習フレームワークに統合した交互デノナイジング拡散プロセス(ADDP)を提案する。
復号化の各ステップでは、まず以前のVQトークンから画素をデコードし、次にデコードされたピクセルから新しいVQトークンを生成する。
学習した表現は、多彩な高忠実度画像の生成や、認識タスクにおける優れた転送性能を示すために使用することができる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:12:29 GMT)
Deep Multi-Threshold Spiking-UNet for Image Processing [90.3] 本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:57:22 GMT)
GeneAvatar: Generic Expression-Aware Volumetric Head Avatar Editing from a Single Image [89.7] 本稿では,多種多様な3DMM駆動ヘッドアバターに適用可能な汎用的なアバター編集手法を提案する。
この目的を達成するために、単一の画像から一貫した3D修正フィールドへのリフト2D編集を可能にする新しい表現対応修正生成モデルを設計する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:58:35 GMT)
PANDA: Prompt Transfer Meets Knowledge Distillation for Efficient Model Adaptation [89.0] 即時転送可能性(i)を正確に予測する新しい指標と,新しいPoTアプローチ(PANDA)を提案する。
提案手法は,各タスクおよびモデルサイズの平均スコアの2.3%(最大24.1%)でバニラPoTアプローチを一貫して上回り,その3。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:00:39 GMT)
Flames: Benchmarking Value Alignment of LLMs in Chinese [86.7] 本稿では,Flamesという値アライメントベンチマークを提案する。
一般的な無害の原則と、特定の中国の価値観を統合するユニークな道徳的側面の両方を包含している。
以上の結果から, 評価されたLLMはフラムに対して比較的低い性能を示した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:15:19 GMT)
CameraCtrl: Enabling Camera Control for Text-to-Video Generation [86.4] ユーザーが希望するコンテンツを作成することができるため、ビデオ生成において制御性は重要な役割を担っている。
既存のモデルは、撮影言語として機能するカメラポーズの正確な制御をほとんど見落としていた。
我々は、テキスト・トゥ・ビデオ(T2V)モデルの正確なカメラポーズ制御を可能にするCameraCtrlを紹介する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:52:41 GMT)
Dichotomy of Early and Late Phase Implicit Biases Can Provably Induce Grokking [81.6] Powerらによる最近の研究は、算術のタスクを学習する際の驚くべき"グロキング"現象を強調した。
ニューラルネットワークはまずトレーニングセットを“記憶”し、完全なトレーニング精度を持つが、ほぼランダムなテスト精度を実現する。
本論文は, 理論設定におけるグルーキング現象を考察し, 初期および後期の暗黙バイアスの2分法により誘導可能であることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:43:18 GMT)
Distilling Semantic Priors from SAM to Efficient Image Restoration Models [80.8] 画像復元(IR)では、セグメンテーションモデルからセグメンテーションの事前情報を活用することが、性能向上のための一般的なアプローチである。
近年のセグメンテーション・アズ・モデル (SAM) は、IRタスクを強化するために先進的なセグメンテーション先行を抽出する強力なツールとして登場した。
本稿では,SAMのセマンティック知識を抽出し,推論プロセスに干渉することなく,IRモデルからの撤退を促進するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:25:07 GMT)
Exploring Latent Pathways: Enhancing the Interpretability of Autonomous Driving with a Variational Autoencoder [79.7] バイオインスパイアされたニューラルサーキットポリシーモデルが革新的な制御モジュールとして登場した。
我々は、変分オートエンコーダとニューラルネットワークポリシーコントローラを統合することで、飛躍的に前進する。
本研究は,変分オートエンコーダへのアーキテクチャシフトに加えて,自動潜時摂動ツールを導入する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:05:47 GMT)
Event Detection from Social Media for Epidemic Prediction [76.9] ソーシャルメディア投稿から疫病関連事象を抽出・分析する枠組みを構築した。
実験では、新型コロナウイルスベースのSPEEDで訓練されたEDモデルが、3つの目に見えない流行の流行を効果的に検出する方法が明らかにされている。
モンキーポックスのWHO流行宣言より4~9週間早く,抽出した事象の報告が急激な増加を示すことを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:31:17 GMT)
Measuring and Controlling Instruction (In)Stability in Language Model Dialogs [72.4] System-promptingは、言語モデルチャットボットをカスタマイズするツールで、特定の命令に従うことができる。
本稿では,仮説を検証し,セルフチャットによる命令安定性の評価を行うベンチマークを提案する。
我々は8ラウンドの会話で重要な指示ドリフトを明らかにした。
そこで本研究では,2つの強力なベースラインに対して良好に比較可能なsplit-softmaxという軽量な手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:13:24 GMT)
MultiParaDetox: Extending Text Detoxification with Parallel Data to New Languages [71.5] テキスト・デトックス化(英: text detoxification)とは、テキストが有害な表面形態(例えば無作為な単語を特徴付けるような)から中性レジスタへパラフレーズ化されるタスクである。
並列テキストデトキシフィケーションコーパスコレクション(ParaDetoxとAPPADIA)の最近のアプローチはモノリンガル設定でのみ検討されている。
本研究では,ParaDetoxパイプラインをMultiParaDetoxを示す複数の言語に拡張し,任意の言語に対して並列デトキシフィケーションコーパスコレクションを自動化することを目的とする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:32:32 GMT)
Few-shot Link Prediction on N-ary Facts [70.8] ハイパーリレーショナル・ファクト(LPHFs)のリンク予測は、ハイパーリレーショナル・事実の欠落要素を予測することである。
Few-Shot Link Prediction on Hyper-Relational Facts (PHFs) は、サポートインスタンスが限定されたハイパーリレーショナルな事実において、欠落したエンティティを予測することを目的としている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:11:01 GMT)
An Empirical Study of Catastrophic Forgetting in Large Language Models During Continual Fine-tuning [70.5] カタストロフィック・ナッシング(英: Catastrophic forgetting、CF)は、機械学習において、モデルが新しい知識を取得しながら学習した情報を忘れたときに発生する現象である。
本研究では,大規模言語モデル(LLM)における連続的指導調律時の忘れ現象を実験的に評価する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:05:51 GMT)
Foundation Models for Time Series Analysis: A Tutorial and Survey [70.4] ファンデーションモデル(FM)は、時系列分析のためのモデル設計のパラダイムを根本的に変えてきた。
本調査は,時系列解析のためのFMの概要を包括的かつ最新のものにすることを目的としている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:38:02 GMT)
Knowledge Boundary and Persona Dynamic Shape A Better Social Media Agent [69.1] パーソナライズされた知識と動的ペルソナ情報に基づくソーシャルメディアエージェントを構築する。
パーソナライズされた知識に対して、外部知識ソースを追加し、エージェントのペルソナ情報とマッチングすることにより、エージェントにパーソナライズされた世界知識を与える。
動的ペルソナ情報については、現在の行動情報を用いてエージェントのペルソナ情報を内部的に検索し、現在の行動に対する多様なペルソナ情報の干渉を低減する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:59:23 GMT)
Value Kaleidoscope: Engaging AI with Pluralistic Human Values, Rights, and Duties [68.7] 価値多元性とは、複数の正しい値が互いに緊張して保持されるという考え方である。
統計的学習者として、AIシステムはデフォルトで平均に適合する。
ValuePrismは、218kの値、権利、義務の大規模なデータセットで、31kの人間が記述した状況に関連付けられています。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:52:03 GMT)
LLM-Rec: Personalized Recommendation via Prompting Large Language Models [62.5] 大きな言語モデル(LLM)は、常識的な知識と推論を活用する能力を示した。
大規模言語モデル(LLM)の最近の進歩は、コモンセンスの知識と推論を活用できることを顕著に示している。
本研究では,パーソナライズされたテキストベースのレコメンデーションを改善するために,テキストエンリッチメントの4つの異なる促進戦略を取り入れた新しいアプローチ LLM-Rec を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:59:51 GMT)
Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.2] ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:41:53 GMT)
GenHowTo: Learning to Generate Actions and State Transformations from Instructional Videos [60.7] 動作とオブジェクト状態変換の時間的一貫性と物理的に妥当な画像を生成するタスクに対処する。
対象の変換を記述した入力画像とテキストプロンプトが与えられた場合、生成した画像は環境を保存し、初期画像内のオブジェクトを変換する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:35:32 GMT)
PointMamba: A Simple State Space Model for Point Cloud Analysis [59.4] 本稿では,大域的モデリングと線形複雑度を考慮したフレームワークであるPointMambaを提案する。
組込み点パッチを入力として,SSMのグローバルモデリング能力を高めるための並べ替え戦略を提案する。
実験の結果,提案したPointMambaは,異なるポイントクラウド分析データセット上で,トランスフォーマーをベースとした性能よりも優れていた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:26:43 GMT)
Rephrase, Augment, Reason: Visual Grounding of Questions for Vision-Language Models [59.1] Rephrase, Augment and Reason (RepARe) は勾配のないフレームワークで、基礎となる視覚言語モデルを用いて画像に関する詳細な情報を抽出する。
その結果、VQAv2では3.85%(絶対)、A-OKVQAでは6.41%、VizWizでは7.94%の増加が見られた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:37:42 GMT)
Segment Any 3D Object with Language [58.5] 本稿では,Segment any 3D Object with LanguagE (SOLE)を紹介した。
具体的には、バックボーンとデコーダの両方にマルチモーダル意味を組み込むマルチモーダル融合ネットワークを提案する。
我々のSOLEは、ScanNetv2、ScanNet200、Replicaベンチマークにおいて、従来の方法よりも大きなマージンで優れている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:59:10 GMT)
Will My Robot Achieve My Goals? Predicting the Probability that an MDP Policy Reaches a User-Specified Behavior Target [57.0] 自律的なシステムがタスクを実行する場合、ユーザの目標を達成する確率のキャリブレーションされた見積もりを維持する必要がある。
本稿では,ユーザの目標が目標間隔として指定される設定について検討する。
我々は、共形予測を反転させて確率推定を計算する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:15:23 GMT)
On the Stability of Iterative Retraining of Generative Models on their own Data [56.2] 混合データセットに対する生成モデルの訓練が与える影響について検討する。
まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。
我々は、正規化フローと最先端拡散モデルを繰り返し訓練することにより、合成画像と自然画像の両方に関する我々の理論を実証的に検証する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:09:40 GMT)
Quantifying Self-diagnostic Atomic Knowledge in Chinese Medical Foundation Model: A Computational Analysis [55.7] ファンデーションモデル(FM)は、直接的で効率的な提案を提供することで、ユーザーが検索エンジンを通して自己診断する方法に革命をもたらす可能性がある。
近年の研究では、GPT-4で評価されたFMの品質や、医学試験に合格する能力に焦点が当てられている。
FMの記憶に蓄えられた自己診断的原子知識の程度を定量化する研究はない。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:48:22 GMT)
A Paradigm Shift: The Future of Machine Translation Lies with Large Language Models [55.4] 深層ニューラルネットワークの発展により、機械翻訳は長年にわたって大きく進歩してきた。
GPT-4やChatGPTのような大規模言語モデル(LLM)の出現は、MTドメインに新しいフェーズを導入している。
我々は、Long-Document Translation、Stylized Translation、Interactive TranslationなどのシナリオにおけるLLMの利点を強調し、新しいMT方向を強調した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:56:56 GMT)
Learning to Compress Prompt in Natural Language Formats [54.1] 大規模言語モデル(LLM)は、複数の自然言語処理タスクを処理するのに優れている。
LLMは、長いコンテキスト、遅い推論速度、高い計算コストによる性能の低下によって制約される。
本研究の目的は、LLM転送性を備えた自然言語形式で長いプロンプトを圧縮することである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:38:31 GMT)
What if you said that differently?: How Explanation Formats Affect Human Feedback Efficacy and User Perception [53.5] 我々は,QAモデルが生成した有理性の効果を分析し,その答えを支持する。
ユーザに対して,様々な形式で誤った回答とそれに対応する有理性を提示する。
このフィードバックの有効性を,文脈内学習を通じて評価する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 00:59:36 GMT)
Already Moderate Population Sizes Provably Yield Strong Robustness to Noise [53.3] 2つの進化的アルゴリズムは、OneMaxベンチマークのランタイムを増大させることなく、一定のノイズ確率を許容できることを示す。
この結果は、ノイズのない子孫は親と騒々しい子孫の間に偏りのある均一な交叉と見なすことができるという、新しい証明の議論に基づいている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:35:52 GMT)
Large Language Models for Mathematicians [53.3] 大規模言語モデル(LLM)は、汎用言語理解、特に高品質なテキストやコンピュータコードを生成する能力に多大な関心を集めている。
本稿では,プロの数学者をどの程度支援できるかについて論じる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:35:40 GMT)
Decoupled Diffusion Models: Simultaneous Image to Zero and Zero to Noise [53.0] 10機能未満の高画質(未条件)の画像生成のためのデカップリング拡散モデル(DDM)を提案する。
我々は,1) 画像から0遷移までをモデル化した解析的遷移確率に基づいて, 学習目標と(2) サンプリング式を逆時間に導出する。
1)無条件画像生成, CIFAR-10, CelebA-HQ-256, 2)超解像, 塩分検出, エッジ検出, 画像入力などの下流処理, テキスト処理, テキスト処理, テキスト処理, テキスト処理, 画像処理, 画像処理などと比較して, 非常に競争力のある性能が得られる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:57:06 GMT)
OSCaR: Object State Captioning and State Change Representation [52.1] 本稿では,OSCaR(Object State Captioning and State Change Representation)データセットとベンチマークを紹介する。
OSCaRは14,084の注釈付きビデオセグメントで構成され、様々なエゴセントリックなビデオコレクションから1,000近いユニークなオブジェクトが集められている。
マルチモーダル大言語モデル(MLLM)を評価するための新しいテストベッドを設定する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 23:14:42 GMT)
How to Train Your YouTube Recommender to Avoid Unwanted Videos [51.7] 興味がない」ボタンと「推奨しないチャンネル」ボタンは、ユーザーが望ましくないリコメンデーションを提示すると、不関心を示すことができる。
われわれはYouTubeユーザーをソックパペットエージェントでシミュレートした。
ボタンが一番うまく機能し、テスト対象のトピックすべてにおいて、このような推奨が大幅に減りました。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:18:23 GMT)
Predicting the Intention to Interact with a Service Robot:the Role of Gaze Cues [51.6] サービスロボットは、接近する人が対話する意図をできるだけ早く知覚する必要がある。
我々は,この認識課題を,対話を意図した潜在的なユーザ意図のシーケンス・ツー・シーケンス分類器を用いて解決する。
我々の主な貢献は、この文脈における人の視線を表す特徴の利点の研究である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:22:54 GMT)
From Shortcuts to Triggers: Backdoor Defense with Denoised PoE [51.3] 言語モデルは、しばしば多様なバックドア攻撃、特にデータ中毒の危険にさらされる。
既存のバックドア防御手法は主に明示的なトリガーによるバックドア攻撃に焦点を当てている。
我々は,様々なバックドア攻撃を防御するために,エンド・ツー・エンドアンサンブルに基づくバックドア防御フレームワークDPoEを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 23:01:17 GMT)
Benchmarking Private Population Data Release Mechanisms: Synthetic Data vs. TopDown [50.4] 本研究では、TopDownアルゴリズムとプライベート合成データ生成を比較し、クエリの複雑さによる精度への影響を判定する。
この結果から,TopDownアルゴリズムは,分散クエリに対して,評価したどの合成データ手法よりもはるかに優れたプライバシー-忠実トレードオフを実現することがわかった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:54:24 GMT)
Leveraging Prototypical Representations for Mitigating Social Bias without Demographic Information [50.3] DAFairは、言語モデルにおける社会的バイアスに対処する新しいアプローチである。
偏見を緩和するために、原型的人口統計テキストを活用し、微調整プロセス中に正規化用語を取り入れる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:14:24 GMT)
A noisy elephant in the room: Is your out-of-distribution detector robust to label noise? [49.9] 我々は、最先端のOOD検出方法20について詳しく検討する。
不正に分類されたIDサンプルとOODサンプルの分離が不十分であることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:40:22 GMT)
Neural Implicit Representations for Physical Parameter Inference from a Single Video [49.8] 本稿では,外見モデルのためのニューラル暗黙表現と,物理現象をモデル化するためのニューラル常微分方程式(ODE)を組み合わせることを提案する。
提案モデルでは,大規模なトレーニングデータセットを必要とする既存のアプローチとは対照的に,単一のビデオから物理的パラメータを識別することが可能になる。
ニューラル暗示表現を使用することで、高解像度ビデオの処理とフォトリアリスティック画像の合成が可能になる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:24:37 GMT)
Joint Multimodal Transformer for Emotion Recognition in the Wild [49.7] マルチモーダルな感情認識は 典型的には 単調なシステムより優れています
キーベースクロスアテンションと融合するジョイントマルチモーダルトランスを利用するMMER法を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:34:04 GMT)
Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.2] LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:06:52 GMT)
Effective Large Language Model Adaptation for Improved Grounding and Citation Generation [48.1] 本稿では,検索した文の応答を基底にして,引用を提供することにより,大規模言語モデル(LLM)の改善に焦点を当てる。
我々は、全体論的観点から基盤を改善する新しいフレームワーク AGREE を提案する。
我々のフレームワークは, LLMを調整し, その要求を自己評価し, 検索した文書に正確な引用を提供する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:04:01 GMT)
Survey of Bias In Text-to-Image Generation: Definition, Evaluation, and Mitigation [47.8] 単純なプロンプトであっても、T2Iモデルは生成された画像に顕著な社会的偏見を示す可能性がある。
本研究は,T2I生成モデルにおけるバイアスに関する最初の広範な調査である。
これらの作業がどのようにしてバイアスの異なる側面を定義し、評価し、緩和するかについて議論する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:36:28 GMT)
Beyond Image Super-Resolution for Image Recognition with Task-Driven Perceptual Loss [47.4] 画像認識のための超解法(SR4IR)は、画像認識性能に有用なSR画像の生成をガイドする。
本稿では,SR4IRが,特定の画像認識タスクに有用なSR画像を生成することで,優れたタスク性能を実現することを実証する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:52:31 GMT)
Topic-based Watermarks for LLM-Generated Text [46.7] 大規模言語モデル(LLM)のための「トピックベース透かしアルゴリズム」を提案する。
提案アルゴリズムは,入力プロンプトの抽出されたトピックや非透かしLLMの出力に基づいて,透かしLLM出力のトークンを生成する方法を決定する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:49:40 GMT)
PatchCURE: Improving Certifiable Robustness, Model Utility, and Computation Efficiency of Adversarial Patch Defenses [46.1] 敵パッチ攻撃に対する最先端の防御は、モデルユーティリティの限界低下によって、強力な証明可能な堅牢性を達成することができる。
この印象的なパフォーマンスは、通常、未定義のモデルに比べて10~100倍の推論時間計算コストがかかる。
本稿では,このトレードオフ問題に対処するためのPatchCUREという防衛フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:14:16 GMT)
Hallucination Diversity-Aware Active Learning for Text Summarization [46.0] LLM(Large Language Models)は、幻覚出力を生成するための妥当性を示す。
幻覚を緩和するための既存の方法は、通常、LLM出力の幻覚を識別し修正するために、人為的なアノテーションを必要とする。
LLM幻覚を緩和する最初のアクティブラーニングフレームワークを提案し,必要な幻覚アノテーションのコストを削減した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:30:27 GMT)
IISAN: Efficiently Adapting Multimodal Representation for Sequential Recommendation with Decoupled PEFT [46.0] IISAN(Intra- and Inter-modal Side Adapted Network for Multimodal Representation)は、シーケンシャルなレコメンデーションシステムのためのプラグイン・アンド・プレイアーキテクチャである。
IISANはフルファインチューニング(FFT)と最先端PEFTのパフォーマンスにマッチする。
マルチモーダルシーケンシャルレコメンデーションタスクでは、47GBからわずか3GBへと大幅に削減される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:58:36 GMT)
A Simple Recipe for Language-guided Domain Generalized Segmentation [45.9] トレーニング中に見えない新しいドメインへの一般化は、ニューラルネットワークを現実世界のアプリケーションにデプロイする上での長年の課題のひとつだ。
本稿では,言語をランダム化の源とすることで意味分節ネットワークを一般化するシンプルなフレームワークを提案する。
筆者らのレシピは, (i) 極小調整による内在的CLIPロバスト性の保存, (ii) 言語駆動型ローカルスタイル拡張, (iii) 訓練中のソースと拡張スタイルを局所的に混合したランダム化という3つの重要な要素から構成される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:20:58 GMT)
Using Interpretation Methods for Model Enhancement [44.3] モデルを強化するために,解釈手法と金の合理性を利用する枠組みを提案する。
私たちのフレームワークは、様々な解釈手法を組み込むことができるという意味で、非常に一般的なものです。
実験結果から,本フレームワークは特に低リソース環境において有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:10:29 GMT)
3D Congealing: 3D-Aware Image Alignment in the Wild [44.3] 3D Congealingは、意味的に類似したオブジェクトをキャプチャする2D画像の3D対応アライメントの問題である。
形状テンプレートやポーズ,あるいは任意のカメラパラメータを仮定することなく,タスクに対処する一般的なフレームワークを導入する。
我々のフレームワークは、対応マッチング、ポーズ推定、画像編集といった様々なタスクに利用できる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:32:12 GMT)
HOI-M3:Capture Multiple Humans and Objects Interaction within Contextual Environment [43.6] HOI-M3は、複数のhumanと複数のオブジェクトの相互作用をモデル化するための、新しい大規模データセットである。
密集したRGBとオブジェクト搭載IMU入力から、人間と物体の両方の正確な3Dトラッキングを提供する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:34:09 GMT)
Two-Phase Multi-Dose-Level PET Image Reconstruction with Dose Level Awareness [43.5] 線量レベルの認識が可能な新しい二相多段PET再構成アルゴリズムを設計する。
事前学習フェーズは、きめ細かい識別特徴と効果的な意味表現の両方を探索するために考案された。
SPET予測フェーズは、事前学習した線量レベルを利用した粗い予測ネットワークを採用して予備結果を生成する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:57:08 GMT)
NLP Systems That Can't Tell Use from Mention Censor Counterspeech, but Teaching the Distinction Helps [43.4] 問題のある内容に反論する対訳は、しばしば有害な言語に言及するが、それ自体は有害ではない。
最近の言語モデルでさえ、言及と使用の区別に失敗していることを示す。
この失敗は、誤報とヘイトスピーチ検出という2つの重要な下流タスクに伝播する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:36:41 GMT)
3D Scene Generation from Scene Graphs and Self-Attention [43.1] 本稿では,シーングラフとフロアプランから3次元シーンを合成する条件付き変分オートエンコーダ(cVAE)モデルを提案する。
我々は、シーン内のオブジェクト間の高レベルな関係をキャプチャするために、自己注意層の特性を利用する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:26:17 GMT)
AAA: an Adaptive Mechanism for Locally Differential Private Mean Estimation [43.0] ローカルディファレンシャルプライバシ(LDP)は、一般的なソフトウェアシステムで採用されている強力なプライバシ標準である。
本稿では, 平均効用に対処する分布認識手法である, 適応型アダプティブ (AAA) 機構を提案する。
我々は、厳密なプライバシー証明、ユーティリティ分析、そしてAAAと最先端のメカニズムを比較した広範な実験を提供する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:22:07 GMT)
FashionEngine: Interactive Generation and Editing of 3D Clothed Humans [42.9] FashionEngineを使えば、3Dのデジタル人間を、人間が世界と対話する方法に合わせてデザインできる。
事前学習された3次元人体拡散モデルは、2次元画像トレーニングデータからセマンティックUV潜在空間内の3次元人間をモデル化する。
マルチモーダルなUVアラインド・サンプラーは、マルチモーダルなユーザ入力に先立つ拡散から高品質で多様な3D人間をサンプリングすることを学ぶ。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:56:17 GMT)
PRISM-TopoMap: Online Topological Mapping with Place Recognition and Scan Matching [42.7] 本稿では,局所的な位置のグラフを保持するトポロジカルマッピング手法であるPRISM-TopoMapを紹介する。
提案手法は,ローカライゼーションとループ閉鎖のためのスキャンマッチングパイプラインと組み合わせた学習可能なマルチモーダル位置認識を含む。
提案手法の広範な実験的評価を,写真実写環境および実ロボット上で行った。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:25:16 GMT)
MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response [42.7] MusiLingoは音楽キャプション生成と音楽関連クエリ応答のための新しいシステムである。
広範囲な音楽キャプションデータセットでトレーニングし、インストラクショナルデータで微調整する。
音楽キャプションの生成と音楽関連Q&Aペアの構成において,その競争性能を実証した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:35:59 GMT)
TAO-Amodal: A Benchmark for Tracking Any Object Amodally [41.5] TAO-Amodalは,数千の動画シーケンスにおいて833の多様なカテゴリを特徴とする。
私たちのデータセットには、カメラフレームから部分的に外れたものを含む、可視または部分的に、あるいは完全に隠されたオブジェクトのための、テクスタモーダルおよびモーダルバウンディングボックスが含まれています。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:09:22 GMT)
An Entropy-based Text Watermarking Detection Method [41.4] 本研究では,エントロピーを用いた透かし検出(EWD)を提案する。
提案手法は,低エントロピーシナリオにおいてより優れた検出性能を達成でき,また,本手法は汎用的であり,異なるエントロピー分布を持つテキストにも適用可能である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:31:27 GMT)
Lookahead Exploration with Neural Radiance Representation for Continuous Vision-Language Navigation [41.4] ビジョン・アンド・ランゲージナビゲーション(VLN)は、エージェントが3D環境における自然言語の指示に従って遠隔地へ移動できるようにする。
より良い航法計画のために、ルックアヘッド探索戦略は、候補地の将来環境を正確に予測し、エージェントの次の行動を効果的に評価することを目的としている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:36:03 GMT)
Distributional Drift Adaptation with Temporal Conditional Variational Autoencoder for Multivariate Time Series Forecasting [41.2] 本稿では,時間経過に伴う動的分布依存をモデル化するための時間的条件変動自動符号化(TCVAE)を提案する。
TCVAEは、依存関係を時間的条件分布として推論し、潜伏変数を活用する。
現状のMTS予測ベースラインに対して,TCVAEの強靭性と有効性を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:58:50 GMT)
Length Extrapolation of Transformers: A Survey from the Perspective of Positional Encoding [41.0] Transformerは、生まれてから嵐によって自然言語処理(NLP)の分野に進出してきた。
大きな言語モデル(LLM)は、その優れた能力のために世界中で注目を集めている。
これらの強力なLLMを含むトランスフォーマーベースのモデルは全て、プリセットされた長さ制限に悩まされており、短いトレーニングシーケンスからより長い推論シーケンスへの一般化は困難である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:56:52 GMT)
This Land is {Your, My} Land: Evaluating Geopolitical Biases in Language Models [40.6] 大規模言語モデル (LLM) では, 異なる言語を問うと, 地理的知識が不整合に記憶されることが示されている。
対象とするケーススタディとして、本質的に議論の的かつ多言語的な課題である領土紛争を考察する。
本稿では,様々な言語における応答のバイアスと一貫性を正確に定量化するための評価指標を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:55:33 GMT)
Exploring Automated Distractor Generation for Math Multiple-choice Questions via Large Language Models [40.5] マルチチョイス質問(MCQ)は、評価や実践において、管理しやすく、格付けし、信頼性の高いフォーマットであるため、ほぼ全てのレベルの教育においてユビキタスである。
MCQの最も重要な側面の1つは、実際の学生の間でよくある誤りや誤解を狙った誤った選択肢である。
現在まで、高品質なイントラクタを開発するというタスクは、拡張性に制限のある教師や学習コンテンツデザイナにとって、労働力と時間を要するプロセスのままである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:31:58 GMT)
Long-context LLMs Struggle with Long In-context Learning [39.8] 大規模言語モデル(LLM)は32Kトークンを超える長いシーケンスを扱うために大きな進歩を遂げた。
本研究は,極端ラベル分類の領域内での長い文脈内学習に焦点を当てた特殊なベンチマーク(liconBench)を紹介する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:59:11 GMT)
SemEval Task 1: Semantic Textual Relatedness for African and Asian Languages [39.8] 意味的テクスト関連性(STR)に関する最初の共有課題を提示する。
14言語にまたがる意味的関連性の広範な現象について検討する。
これらの言語は5つの異なる言語族の出身であり、主にアフリカとアジアで話されている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:26:00 GMT)
Imitation Game: A Model-based and Imitation Learning Deep Reinforcement Learning Hybrid [39.6] 本稿では,モデルに基づくDeep Reinforcement Learningと模倣学習を組み合わせたハイブリッドエージェントアーキテクチャへの取り組みについて述べる。
本稿では,モデルに基づくDeep Reinforcement Learningと模倣学習を組み合わせたハイブリッドエージェントアーキテクチャへの取り組みについて述べる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:55:30 GMT)
Is attention required for ICL? Exploring the Relationship Between Model Architecture and In-Context Learning Ability [39.4] そこで本研究では,テキスト内学習タスクのスイート間で因果言語モデリングが可能な13のモデルを評価する。
検討されたアーキテクチャはすべて、以前文書化されたよりも幅広い条件下でコンテキスト内学習を行うことができる。
いくつかの注意すべき代替手段は、トランスフォーマーよりもコンテキスト内学習者と競合することがある。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:54:53 GMT)
On the Role of Summary Content Units in Text Summarization Evaluation [39.1] 文章要約コンテンツ単位(SCU)を近似する2つの新しい戦略を示す。
STUとSMUは競合するが、最高の近似品質はSGUによって達成される。
また、簡単な文分解ベースライン(SSU)を通して、SCUが短い要約をランク付けする際に最も価値を提供するが、ランキングシステムや長い要約ではそれほど役に立たないことを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:09:44 GMT)
Coherent Control of an Optical Quantum Dot Using Phonons and Photons [38.7] 光学的2レベルシステム(qubits)の独特な利点を光学学に示す。
クビット状態は、多種多様な駆動スキームを用いてコヒーレントに制御できる。
マイクロ波-光プロセスにおける信号-背景散乱を改善する方法を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:25:35 GMT)
Ignore Me But Don't Replace Me: Utilizing Non-Linguistic Elements for Pretraining on the Cybersecurity Domain [38.5] サイバーセキュリティ情報はしばしば技術的に複雑で、構造化されていないテキストを通して中継される。
高レベルの専門知識を持つテキストドメインでは、ドメイン内のコーパスを事前訓練することが、ドメインの専門知識を得るための言語モデルとして一般的な方法である。
我々は,異なる事前学習手法を提案し,下流タスクと探索タスクを通してその効果を評価する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:46:42 GMT)
A Linear Time and Space Local Point Cloud Geometry Encoder via Vectorized Kernel Mixture (VecKM) [37.9] VecKMは、記述的で、効率的で、ノイズに対して堅牢な、新しいローカルポイント・クラウド・ジオメトリ・エンコーダである。
VecKMは計算とメモリコストを$O(n2+nKd)$から$O(nd)$に下げる試みとして初めて成功した。
VecKMは100倍高速な推論速度だけでなく、最も強い記述性を示し、既存のエンコーダと比較する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:01:21 GMT)
Improved Text Emotion Prediction Using Combined Valence and Arousal Ordinal Classification [37.8] テキストから感情を分類する手法を導入し,様々な感情の相違点と相違点を認識・区別する。
提案手法は感情予測において高い精度を保ちながら,誤分類の場合の誤りの程度を著しく低減する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:06:30 GMT)
How Trustworthy are Open-Source LLMs? An Assessment under Malicious Demonstrations Shows their Vulnerabilities [37.1] 我々は,オープンソースのLarge Language Models (LLMs) の信頼性に対する敵意評価を行う。
本稿では,信頼度攻撃のための悪質なデモンストレーションを慎重に行うことで,CoUの促進戦略であるAdvCoUを提案する。
我々の実験は、Vicuna、MPT、Falcon、Mistral、Llama 2など、最近のオープンソースのLLMシリーズを網羅している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:21:55 GMT)
Generative AI for Immersive Communication: The Next Frontier in Internet-of-Senses Through 6G [37.1] 感覚のインターネット(Internet of Senses, IoS)は、多感覚体験を提供することを目指しており、私たちの物理的現実において、私たちの知覚は単なる視覚と音以上のものであることを認識している。
本稿では,没入型マルチ感覚メディアを駆動する既存の技術について考察し,その能力と応用の可能性について考察する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:57:05 GMT)
Towards Robust 3D Pose Transfer with Adversarial Learning [36.4] 望ましいポーズをターゲットメッシュに転送することを目的とした3Dポーズ転送は、最も困難な3D生成タスクの1つである。
以前の試みは、よく定義されたパラメトリックな人体モデルや骨格関節を駆動するポーズ源として頼っていた。
3次元外部プレゼンテーション(ポーズ)を効果的に学習するカスタマイズされたMAEである3D-PoseMAEを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:03:39 GMT)
Using Large Language Models to Understand Telecom Standards [35.3] 大きな言語モデル(LLM)は、関連する情報へのより高速なアクセスを提供する。
質問応答(QA)アシスタントとして使用される最先端のLCMの性能を評価する。
その結果,LLMはテレコム技術文書の信頼できる参照ツールとして利用できることがわかった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:54:51 GMT)
More Samples or More Prompts? Exploring Effective In-Context Sampling for LLM Few-Shot Prompt Engineering [35.1] In-Context Smpling (ICS) を提案し、複数のICLプロンプト入力の構成を最適化し、確実な予測を行う。
3つのデータ類似性に基づくICS戦略による詳細な評価は、これらの戦略がLLMの性能をさらに高める可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:16:40 GMT)
Is Meta-training Really Necessary for Molecular Few-Shot Learning ? [35.0] わずかながらの学習は、薬物発見に大きな関心を惹きつけており、近年急速に成長している文献は、主に複雑なメタラーニング戦略を含んでいる。
分子データに対するより簡単な微調整手法を再検討し、マハラノビス距離に基づく正規化二次プローブ損失を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:20:51 GMT)
MMCert: Provable Defense against Adversarial Attacks to Multi-modal Models [34.8] 我々は,マルチモーダルモデルに対する敵攻撃に対する最初の認証された防御であるMCCertを提案する。
我々は,マルチモーダル道路セグメンテーションタスクとマルチモーダル道路セグメンテーションタスクと,マルチモーダル感情認識タスクの2つのベンチマークデータセットを用いて,MCCertを評価した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:05:46 GMT)
Vulnerabilities of Foundation Model Integrated Federated Learning Under Adversarial Threats [34.5] フェデレートラーニング(FL)は、データプライバシとセキュリティに関連する機械学習における重要な問題に対処するが、特定の状況下でのデータ不足と不均衡に悩まされる。
ファンデーションモデル(FM)の出現は、既存のFLフレームワークの制限に対する潜在的な解決策を提供する。
FM統合FL(FM-FL)の脆弱性を敵の脅威下で調査した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:31:24 GMT)
HeMeNet: Heterogeneous Multichannel Equivariant Network for Protein Multitask Learning [34.0] 本稿では,3次元タンパク質構造の入力に基づいて,複数のタスクを協調的に処理するニューラルネットワークモデルを提案する。
特に,我々はまず,Protein-MTと呼ばれる標準構造に基づくマルチタスクベンチマークを構築した。
そこで我々は,HeMeNet(Heterogeneous Multi Channel Equivariant Network)と呼ばれる,マルチタスク学習のための新しいグラフニューラルネットワークを開発した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:53:45 GMT)
JRDB-PanoTrack: An Open-world Panoptic Segmentation and Tracking Robotic Dataset in Crowded Human Environments [33.9] JRDB-PanoTrackは,ロボットシステムにおける環境理解のためのオープンワールド・パノプティクス・セグメンテーションとトラッキング・ベンチマークである。
JRDB-PanoTrackは,1)屋内および屋外の混雑シーンを含む各種データと,総合的な2Dおよび3D同期データモダリティを含む。
クローズドおよびオープンワールド認識ベンチマーク用のさまざまなオブジェクトクラス、評価のためのOSPAベースのメトリクス。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:43:22 GMT)
READ: Improving Relation Extraction from an ADversarial Perspective [33.4] 関係抽出(RE)に特化して設計された対角的学習法を提案する。
提案手法では,シーケンスレベルの摂動とトークンレベルの摂動の両方をサンプルに導入し,個別の摂動語彙を用いてエンティティとコンテキストの摂動の探索を改善する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:42:44 GMT)
PKU-DyMVHumans: A Multi-View Video Benchmark for High-Fidelity Dynamic Human Modeling [33.0] PKU-DyMVHumansは高忠実度再構成と動的人間のシナリオのレンダリングのための汎用的な人間中心のデータセットである。
フレーム数は820万フレームで、56台以上のカメラが様々なシナリオで同期している。
ニューラルフィールド(NeRF)に基づくシーン表現の最近の進歩に触発されて、私たちは、オフザシェルフフレームワークを慎重にセットアップした。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:16:05 GMT)
Language Model Guided Interpretable Video Action Reasoning [33.0] 我々はLanguage-guided Interpretable Action Recognition framework (LaIAR)という新しいフレームワークを提案する。
LaIARは、言語モデルからの知識を活用して、認識能力とビデオモデルの解釈可能性の両方を強化する。
本質的には、ビデオモデルと言語モデルを整合させるタスクとして、ビデオモデル決定を理解することの問題を再定義する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:31:13 GMT)
Code-Aware Prompting: A study of Coverage Guided Test Generation in Regression Setting using LLM [32.4] テスト生成における大規模言語モデルのコード認識促進戦略であるSymPromptを提案する。
SymPromptは、正しいテスト世代を5倍に増やし、CodeGen2の相対カバレッジを26%向上させる。
特に、GPT-4に適用すると、SymPromptはベースラインのプロンプト戦略に比べて2倍以上のカバレッジが向上する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:23:03 GMT)
SVGDreamer: Text Guided SVG Generation with Diffusion Model [31.8] SVGDreamerと呼ばれる新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
SIVEプロセスは、前景オブジェクトと背景への合成の分解を可能にする。
VPSDアプローチは、形状の平滑化、彩度の過飽和、多様性の制限、収束の遅い問題に対処する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:25:04 GMT)
Linear Combination of Saved Checkpoints Makes Consistency and Diffusion Models Better [31.7] Diffusion Models (DM) と Consistency Models (CM) は、様々なタスクにおいて優れた生成品質を持つ人気のある生成モデルである。
本研究では,SGDでは到達できないが,適切なチェックポイント平均化によって得られるような,高品質なモデルウェイトがしばしば存在することを明らかにする。
進化探索から導出される係数とトレーニング軌道に沿ったチェックポイントを組み合わせることで,DMとCMの性能を向上させる,シンプルで効率的かつ効率的なLCSCを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:59:39 GMT)
PersonaLLM: Investigating the Ability of Large Language Models to Express Personality Traits [30.8] 本研究では,ビッグファイブ・パーソナリティ・モデルに基づく大規模言語モデル(LLM)の行動について検討する。
その結果, LLMペルソナの自己申告したBFIスコアは, 指定した性格タイプと一致していることがわかった。
人間の評価は、人間は最大80%の精度でいくつかの性格特性を知覚できることを示している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:06:53 GMT)
Is Mamba Effective for Time Series Forecasting? [30.2] 状態空間モデル(SSM)は、シーケンス内の複雑な依存関係を処理する能力によって、注目を集めている。
時系列予測のための,S-Mamba(S-Mamba)というマンバモデルを提案する。
いくつかのデータセットの実験では、S-Mambaは計算オーバーヘッドを低く保ち、主要な性能を達成している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:03:37 GMT)
GPT-Fathom: Benchmarking Large Language Models to Decipher the Evolutionary Path towards GPT-4 and Beyond [29.8] GPT-Fathomは、OpenAI Evals上に構築された大規模言語モデル(LLM)のための、オープンソースで再現可能な評価スイートである。
私たちは,7つの機能カテゴリにまたがる20以上のベンチマークで,10以上のLLMとOpenAIのレガシモデルを評価しました。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:51:38 GMT)
Face It Yourselves: An LLM-Based Two-Stage Strategy to Localize Configuration Errors via Logs [29.7] コンフィグレーションエラーはメンテナと新しいエンドユーザにとって大きな課題となる。
ログがほとんどのエンドユーザに容易にアクセス可能であることを考慮し、設定エラーのローカライズにログを利用する際の課題と機会を概説する予備的研究を行う。
予備研究から得られた知見に基づいて,エンドユーザーがログに基づいて根源構成特性をローカライズするためのLLMベースの2段階戦略を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:53:41 GMT)
Constrained Robotic Navigation on Preferred Terrains Using LLMs and Speech Instruction: Exploiting the Power of Adverbs [29.5] 本稿では,生成AIを用いた地図のないオフロードナビゲーションにおける大規模言語モデルの活用について検討する。
本稿では,ロボットがWhisperを通じてテキストに変換された音声命令を受信し,ランドマークや好地,重要な副詞を抽出し,制限されたナビゲーションのための速度設定に変換する手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:46:13 GMT)
A Rationale-centric Counterfactual Data Augmentation Method for Cross-Document Event Coreference Resolution [29.3] 構造因果モデル(SCM)を用いたベースラインECRシステムの意思決定過程を定式化する。
LLM-in-the-loop を用いた有理中心の反実データ拡張法を開発した。
提案手法は,3つのクロスドキュメント ECR ベンチマークの最先端性能を実現し,ドメイン外シナリオの堅牢性を実証する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:15:07 GMT)
Iterative Refinement of Project-Level Code Context for Precise Code Generation with Compiler Feedback [29.1] 大規模言語モデル(LLM)は、コードの自動生成において顕著な進歩を示している。
しかし、LLMベースのコード生成を実際のソフトウェアプロジェクトに組み込むことが課題となっている。
本稿では,プロジェクトレベルのコードコンテキストを反復的に洗練するProCoderという新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:17:12 GMT)
Cross-modality debiasing: using language to mitigate sub-population shifts in imaging [28.9] サブポピュレーションシフトは、アルゴリズムバイアスの重要な源であり、分散ロバスト性を要求する。
近年の研究では、視覚言語モデルCLIPのような多モード基礎モデルに固有の分布ロバスト性が確認されている。
本稿では,画像特徴表現の劣化を抑えるために自然言語入力を活用することを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:47:23 GMT)
GraphInstruct: Empowering Large Language Models with Graph Understanding and Reasoning Capability [28.7] 大規模言語モデル(LLM)のグラフ理解能力の評価と向上を行う。
本稿では,21の古典的グラフ推論タスクを含むGraphInstructというベンチマークを提案する。
我々は,グラフ理解能力の顕著な向上を示す効率的な命令チューニングにより,GraphLMを構築する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:57:16 GMT)
Where to Move Next: Zero-shot Generalization of LLMs for Next POI Recommendation [28.6] Next Point-of-interest (POI)レコメンデーションは、ユーザが周囲の環境を探索するための貴重な提案を提供する。
既存の研究は、大規模ユーザのチェックインデータからレコメンデーションモデルを構築することに依存している。
近年,事前訓練された大規模言語モデル (LLM) は,様々なNLPタスクにおいて大きな進歩を遂げている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:33:04 GMT)
MapGuide: A Simple yet Effective Method to Reconstruct Continuous Language from Brain Activities [28.5] そこで本研究では,脳活動からマッピングしたテキスト埋め込みとの比較により,テキスト再構成を誘導する手法を提案する。
その結果, BLEUとMETEORでは平均77%, 54%の改善が見られた。
このような洞察は、将来の作業のために脳の活動から言語を再構築する作業を単純化することができる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:05:41 GMT)
Do Localization Methods Actually Localize Memorized Data in LLMs? A Tale of Two Benchmarks [28.5] 2つのベンチマークは、記憶データに責任があるコンポーネントをピンポイントするローカライズ手法の能力を評価する。
異なる視点にもかかわらず、我々の2つのベンチマークは5つのローカライゼーション手法の一貫性のあるランキングを得る。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:32:40 GMT)
How to Teach Programming in the AI Era? Using LLMs as a Teachable Agent for Debugging [28.3] 大規模言語モデル(LLM)は、生成スキルに優れ、実行不可能な速度でコンテンツを作成することができる。
人間の初心者は、教師アシスタントの役割を担い、LLMで教えられるエージェントのコードを支援する。
そこで我々は,人間の初心者が指導アシスタントの役割を担い,LLMを利用した学習エージェントのコード作成を支援する,デバッグの意図的な実践を促進する新しいシステムであるPhyを紹介した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:57:02 GMT)
Two Heads are Better than One: Nested PoE for Robust Defense Against Multi-Backdoors [28.3] 既存の防御機構は、攻撃者が採用するトリガーの種類は1つしかないと仮定する。
本研究では,Nested Product of Experts(NPoE)防衛フレームワークを提案する。
NPoEは、別々に、およびトリガー混合物において、様々なトリガーに対して効果的に防御する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:58:38 GMT)
IndoCulture: Exploring Geographically-Influenced Cultural Commonsense Reasoning Across Eleven Indonesian Provinces [28.2] 本稿では,言語モデル推論能力に対する地理的要因の影響を理解することを目的としたIndoCultureを紹介する。
テンプレートやオンラインスクレイピングに依存していた以前の作業とは対照的に、ローカルの人たちに、コンテキストと妥当なオプションを手作業で開発するように頼んで、IndoCultureを作りました。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:32:58 GMT)
"It's a Fair Game", or Is It? Examining How Users Navigate Disclosure Risks and Benefits When Using LLM-Based Conversational Agents [27.5] 大規模言語モデル(LLM)ベースの会話エージェント(CA)の普及は、多くのプライバシー上の懸念を引き起こす。
実世界のChatGPT会話における機密情報開示を分析し,19名のLCMユーザを対象に半構造化インタビューを行った。
LLMベースのCAを使用する場合,ユーザは常に,プライバシやユーティリティ,利便性のトレードオフに直面しています。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:32:06 GMT)
Diffusion 3D Features (Diff3F): Decorating Untextured Shapes with Distilled Semantic Features [27.4] Diff3Fは、非テクスチャ入力のためのクラスに依存しない特徴記述子である。
画像基礎モデルから入力形状への拡散特性を蒸留する。
その過程で2次元で(拡散)特徴を生成し、その後、元の表面に持ち上げて集約する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:11:35 GMT)
Asymptotics of Language Model Alignment [27.4] 最適KL制約RL解が大きな偏差原理を満たすことを示す。
また、報酬のスケールした累積物の成長速度は、適切なレニイクロスエントロピーによって特徴づけられることを示した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:40:07 GMT)
AI WALKUP: A Computer-Vision Approach to Quantifying MDS-UPDRS in Parkinson's Disease [26.4] パーキンソン病(英: Parkinson's Disease、PD)は、神経変性疾患の2番目に多い疾患である。
PDの既存の評価方法は、様々な種類の運動症状と疾患の進行の重症度を評価するために、運動障害協会(英語版) - Unified Parkinson's Disease Rating Scale (MDS-UPDRS) である。
我々は、コンピュータビジョンベースのソリューションを使用して、カメラに基づいて人間のポーズ画像をキャプチャし、アルゴリズムを用いて動き分析を再構築し、特徴工学を通して動きの量の特徴を抽出したいと考えている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:53:34 GMT)
Effective internal language model training and fusion for factorized transducer model [26.4] ニューラルトランスデューサの内部言語モデル(ILM)は広く研究されている。
因子化トランスデューサモデルのための新しいILMトレーニングと復号化戦略を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:01:05 GMT)
Steerers: A framework for rotation equivariant keypoint descriptors [26.3] 大きな視点の変化に対して差別的で一致可能なキーポイント記述は、3次元再構成に不可欠である。
入力画像の回転を符号化する記述空間における線形変換を学習する。
回転不変画像マッチングベンチマークであるAIMSとRoto-360の最先端結果を得た。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:40:33 GMT)
Peer-aided Repairer: Empowering Large Language Models to Repair Advanced Student Assignments [26.2] 我々は,大規模言語モデルを利用したPaRというフレームワークを開発した。
PaRは、ピアソリューション選択、マルチソースプロンプト生成、プログラム修復の3段階で動作する。
Defects4DSと他のよく検証されたTHEPデータセットの評価は、PaRが新しい最先端のパフォーマンスを達成することを明らかにしている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:12:21 GMT)
Identifying Self-Disclosures of Use, Misuse and Addiction in Community-based Social Media Posts [26.2] 我々は,オピオイド使用の6つの異なる位相をラベル付けした,様々なサブレディットからの2500オピオイド関連ポストのコーパスを提示する。
すべての投稿で、私たちは、アノテーションの品質とモデル開発の両方において、スパンレベルの説明を注釈付けし、彼らの役割を決定的に研究します。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:43:27 GMT)
Generative AI in the Wild: Prospects, Challenges, and Strategies [26.1] 本研究では,総合的LUA(Learning, Using Assessing)フレームワークにおける人間-ゲンカイ共創過程について検討した。
Prospects-GenAIは、人間の専門知識とGenAI能力の共創を大いに促進します。
ユーザは、このような課題の多くを克服するために、さまざまな戦略を積極的に考案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:54:04 GMT)
Beyond Accuracy: Evaluating the Reasoning Behavior of Large Language Models -- A Survey [25.7] 大規模言語モデル(LLM)は、最近、推論を含むタスクで顕著なパフォーマンスを示している。
これらの成功にもかかわらず、LLMの推論能力の深さは未だ不明である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:46:31 GMT)
CSST Strong Lensing Preparation: a Framework for Detecting Strong Lenses in the Multi-color Imaging Survey by the China Survey Space Telescope (CSST) [25.5] 強い重力レンズはダークマターとダークエネルギー特性を研究する強力なツールである。
我々は,階層型視覚変換器をベースとしたスライディングウインドウ技術を用いて,画像全体に強いレンズシステムを求めるフレームワークを開発した。
我々のフレームワークは、それぞれ0.98と0.90の精度とリコール率を達成する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:44:30 GMT)
Unleash the Potential of CLIP for Video Highlight Detection [25.4] HL-CLIPは、ビデオハイライト検出タスクを最適化する手法である。
ハイライト検出タスクであるQVHighlight Benchmarkでは、最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:01:58 GMT)
CLAPNQ: Cohesive Long-form Answers from Passages in Natural Questions for RAG systems [25.4] 完全なRAGパイプラインのためのロングフォーム質問回答データセットのベンチマークであるClapNQを提示する。
ClapNQの答えは簡潔で、全通より3倍小さく、結束性があり、複数の節は連続しない。
本稿では,基礎となるRAGの改善の余地がまだ残っている地域に焦点を当てた,ClapNQのベースライン実験と解析を行う。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:00:11 GMT)
TEMPO: Prompt-based Generative Pre-trained Transformer for Time Series Forecasting [24.8] 本稿では,時系列表現を効果的に学習できる新しいフレームワークTEMPOを提案する。
TEMPOは、様々な領域のデータから現実世界の時間現象を動的にモデル化する機能を拡張する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:39:08 GMT)
Large Human Language Models: A Need and the Challenges [24.6] 大規模人文言語モデル(LHLM)の創出に向けた3つの立場を提唱する。
第一に、LMトレーニングには人間の文脈を含めるべきである。第二に、LHLMは、人々が自分のグループ以上であることを認識すべきである。
第3に、LHLMは人間の文脈の動的かつ時間的に依存する性質を説明できるべきである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:30:12 GMT)
Towards Generalizable and Faithful Logic Reasoning over Natural Language via Resolution Refutation [24.6] 本稿では,GFaiR(Generalizable and Faithful Reasoner)という新しいフレームワークを提案する。
解法の難解化は、推論規則を拡張し、矛盾による証明の原理を採用することによって、全ての一階論理推論問題を解く能力を持つ。
我々のシステムは、単純なシナリオでパフォーマンスを維持しながら、複雑なシナリオで最先端のパフォーマンスを達成することで、これまでの作業より優れています。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:28:44 GMT)
SLIDE: Reference-free Evaluation for Machine Translation using a Sliding Document Window [24.5] 本稿では,文ブロックで動作するSLIDE(SLIding Document Evaluator)というメトリクスを提案する。
SLIDEは文レベルベースラインよりもペアワイズシステムの精度がかなり高いことがわかった。
このことは、ソースの曖昧さを曖昧にするために、ソースコンテキストが人間の参照と同じ情報を提供する可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:36:24 GMT)
EarthNets: Empowering AI in Earth Observation [24.2] 地球観測(EO)は、リモートセンシングデータを用いて惑星地球の状態を監視することを目的としている。
本稿では,500以上の公開データセットの総合的なレビューを行う。
モデル評価のための新しいベンチマークを構築するために,データセットを計測,ランク付け,選択することを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:45:06 GMT)
ViTamin: Designing Scalable Vision Models in the Vision-Language Era [24.1] Vision Transformer (ViTs) は、イメージエンコーダのデフォルトの選択肢である。
ViTamin-Lは、ViT-Lを2.0%画像ネットゼロショット精度で大幅に上回る。
436万のパラメータしか持たないViTamin-XLは、82.9%のImageNetゼロショット精度を実現している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:40:29 GMT)
Confronting LLMs with Traditional ML: Rethinking the Fairness of Large Language Models in Tabular Classifications [24.0] 大規模言語モデル (LLM) は, 学習データから社会的偏見を継承する傾向にあり, 分類作業における公平性に大きな影響を及ぼすことを示した。
この観察は、社会的バイアスがLSM自体に固有のものであり、事前学習されたコーパスから継承されていることを強調している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:29:20 GMT)
Take One Step at a Time to Know Incremental Utility of Demonstration: An Analysis on Reranking for Few-Shot In-Context Learning [23.9] In-Context Learning (ICL)は大規模言語モデル(LLM)の創発的能力である
従来の研究では、ラベルとしてLLMの出力を使用することが、デモを選択するためのトレーニングモデルに有効であることが示されている。
本稿では,LLMの出力確率に着目して,異なるユーティリティ関数の解析を行う。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:05:40 GMT)
How COVID-19 has Impacted the Anti-Vaccine Discourse: A Large-Scale Twitter Study Spanning Pre-COVID and Post-COVID Era [23.5] 新型コロナウイルスのパンデミックは、ワクチンに対する感情を理解し緩和することがいかに重要かを示した。
本研究は,Twitter上での抗ワクチンポストの大規模調査を通じて,これらの疑問に答えようとするものである。
本稿では,ツイートを11種類のアンチヴァックスに分類する2つの新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:18:41 GMT)
SGSH: Stimulate Large Language Models with Skeleton Heuristics for Knowledge Base Question Generation [23.4] 知識ベース質問生成(KBQG)は、KBから抽出された3つの事実の集合から自然言語の質問を生成することを目的としている。
事前学習技術の進歩により、大きな言語モデル (LLM) (例: GPT-3.5) は間違いなくより意味的な知識を持っている。
KBQGを向上させるため,SGSH(Skeleton Heuristics による GPT-3.5 のインセンティブを高めるためのシンプルで効果的なフレームワーク)を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:17:36 GMT)
On Retrieval Augmentation and the Limitations of Language Model Training [22.9] トレーニングデータだけで、$k$-nearestの隣人($k$NN)検索による言語モデルの強化は、その難易度を低下させる可能性がある。
トレーニングデータに因果関係のない追加情報が含まれている設定において、LM能力を評価するための新しいデータセットを作成する。
k$NN検索をより使いやすくするために,従来の検索に代えてデータストアキーを値にマップする多層パーセプトロンモデルを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:23:23 GMT)
Alpha Invariance: On Inverse Scaling Between Distance and Volume Density in Neural Radiance Fields [22.8] 3次元シーン次元におけるスケールのあいまいさは、ニューラルラディアンス場の密度の大きさのあいまいさをもたらす。
1)ログ空間における距離密度と体積密度のパラメータ化,2)高線透過性を保証するための識別非依存戦略を推奨する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:58:57 GMT)
$\texttt{LM}^\texttt{2}$: A Simple Society of Language Models Solves Complex Reasoning [22.8] 大規模言語モデル(LLMS)は複雑で多段階の推論をしばしば失う。
本稿では,これらの課題に対処するためにLM2を提案する。
LM2は分解、解法、検証を3つの異なる言語モデルにモジュール化する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:23:10 GMT)
GLEMOS: Benchmark for Instantaneous Graph Learning Model Selection [21.6] GLEMOSは、即時グラフ学習(GL)モデル選択のためのベンチマークである。
リンク予測やノード分類を含む基本的なGLタスクのベンチマークデータを提供する。
新しいモデル、新しいグラフ、新しいパフォーマンスレコードで簡単に拡張できるように設計されている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:13:00 GMT)
MuChin: A Chinese Colloquial Description Benchmark for Evaluating Language Models in the Field of Music [21.4] MuChinは中国語で書かれた最初のオープンソースの音楽記述ベンチマークである。
音楽の理解と記述において,マルチモーダル大規模言語モデルの性能を評価するように設計されている。
ベンチマークに関連するすべてのデータとスコアリングのコードがオープンソース化された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:15:35 GMT)
Leveraging Contextual Information for Effective Entity Salience Detection [21.3] クロスエンコーダアーキテクチャを用いた中規模言語モデルの微調整により,機能工学的アプローチよりも優れた性能が得られることを示す。
また、命令調整言語モデルのゼロショットプロンプトは、タスクの特異性と複雑さを示す劣った結果をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 23:53:28 GMT)
Visual Concept Connectome (VCC): Open World Concept Discovery and their Interlayer Connections in Deep Models [21.2] 視覚概念接続(VCC)は、人間の解釈可能な概念とその層間接続を、完全に教師なしの方法で発見する。
提案手法は,すべての層にまたがる接続重み付けを同時に実現し,ネットワーク構造のグローバルな解析に有効である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:40:55 GMT)
Large Language Models for Orchestrating Bimanual Robots [19.6] 大型言語モデル (LLM) は様々なロボットタスクを制御している。
しかし、連続空間におけるコーディネートは双対問題にとって特に困難である。
本稿では,Language-based Bimanual Orchestration (LABOR)を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:08:35 GMT)
Pre-trained Vision and Language Transformers Are Few-Shot Incremental Learners [19.6] FSCIL(Few-Shot Class Incremental Learning)は、クラスごとにいくつかのサンプルしか与えられていないことを忘れずに、新しいクラスを漸進的に学習するモデルを必要とするタスクである。
FSCILは2つの大きな課題に直面している。
大規模なデータセットで事前訓練された視覚や言語変換器のような大規模モデルは、数発のインクリメンタル学習者には優れていると我々は主張する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:23:22 GMT)
Learned Kernels for Sparse, Interpretable, and Efficient Medical Time Series Processing [19.5] 医療信号の迅速かつ信頼性が高く正確な解釈は、臨床的意思決定に不可欠である。
ディープラーニングモデルは、しばしば計算集約的であり、解釈可能性に欠ける。
本稿では,医療時系列処理のための単一層ニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:31:51 GMT)
3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations [19.4] 3次元拡散政策(DP3)は、新しい視覚模倣学習手法である。
実験では、DP3は10のデモでほとんどのタスクを処理し、24.2%の相対的な改善でベースラインを超えた。
実際のロボット実験では、DP3は頻繁に行う基準法とは対照的に、安全要件にほとんど違反しない。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:59:57 GMT)
Pregnant Questions: The Importance of Pragmatic Awareness in Maternal Health Question Answering [19.2] 本研究では,母親が妊娠と乳幼児ケアについて質問したときの仮定と含意,あるいは実践的推論について検討する。
我々は3つの異なるソースから500の質問から2,727の推論データセットを収集します。
既存のQAパイプラインを実用的な推論でインフォームすると、より完全な応答が生成されることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:42:21 GMT)
LoSh: Long-Short Text Joint Prediction Network for Referring Video Object Segmentation [18.8] ビデオオブジェクトセグメンテーション(RVOS)の参照は、所定のテキスト表現によって参照されるターゲットインスタンスをビデオクリップにセグメントすることを目的としている。
テキスト表現は通常、インスタンスの外観、動作、および他者との関係に関する洗練された記述を含む。
本稿では,元来の長文表現から主語中心の短文表現を取り出すことにより,この問題に対処する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:10:53 GMT)
Proximal Oracles for Optimization and Sampling [18.8] 非滑らかな目的関数による凸最適化と非滑らかなポテンシャルによる対数凹型サンプリングについて検討する。
非滑らか性による課題を克服するため、アルゴリズムは最適化とサンプリングに2つの強力な近位フレームワークを用いる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:52:28 GMT)
A (More) Realistic Evaluation Setup for Generalisation of Community Models on Malicious Content Detection [18.8] 本稿では,本手法を用いたモデル一般化のための新しい評価手法を提案する。
提案した数ショットのサブグラフを用いて学習したグラフメタラーナは、インダクティブセットアップにおいて標準コミュニティモデルより優れた性能を示すことを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:32:21 GMT)
DPA-Net: Structured 3D Abstraction from Sparse Views via Differentiable Primitive Assembly [18.7] スパースRGB画像から構造化された3D抽象化を学習するための、微分可能なレンダリングフレームワークを提案する。
異なるボリュームレンダリングを活用することで,本手法は3次元監視を必要としない。
本手法は,スパースビューからの3次元プリミティブ抽象に対する最先端の代替手段よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:09:25 GMT)
Sentence-level Media Bias Analysis with Event Relation Graph [18.4] メディアバイアスを文レベルで識別し,読者の意見に反する偏見文をピンポイントで特定する。
特に、偏見文中の事象は、文書内の他の事象と関連して理解する必要があることを観察する。
本稿では,文レベルのバイアス識別のための事象と事象の関係性を明確に推論するために,事象関係グラフを構築することを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:16:03 GMT)
VidEdit: Zero-Shot and Spatially Aware Text-Driven Video Editing [18.2] ゼロショットテキストベースのビデオ編集のための新しい方法であるVidEditを紹介する。
実験の結果,VidEditはDAVISデータセット上で最先端の手法より優れていることがわかった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:08:12 GMT)
FedSN: A Novel Federated Learning Framework over LEO Satellite Networks [18.2] 多数の低軌道軌道(LEO)衛星が打ち上げられ、SpaceXなどの商業企業によって宇宙に投入された。
LEO衛星が搭載するマルチモーダルセンサにより、通信だけでなく、空間変調認識やリモートセンシング画像分類など、さまざまな機械学習アプリケーションにも機能する。
本稿では,これらの課題に対処するための一般FLフレームワークとしてFedSNを提案し,LEO衛星上でのデータ多様性について検討する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:53:20 GMT)
Unifying Qualitative and Quantitative Safety Verification of DNN-Controlled Systems [18.0] 深部強化学習技術の急速な進歩は、ディープニューラルネットワーク(DNN)を利用した安全クリティカルシステムの監視を可能にする
既存の検証アプローチのほとんどは定性的アプローチに依存しており、主に到達可能性分析を利用している。
本稿では,定性的・定量的な安全性検証問題を統一するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:31:51 GMT)
Co-Speech Gesture Video Generation via Motion-Decoupled Diffusion Model [18.0] 共同音声ジェスチャーは、人間と機械の相互作用において優れた視覚効果を得ることができる。
共同音声ジェスチャビデオを生成するための新しい動き分離フレームワークを提案する。
提案手法は,動作評価と映像評価の両方において,既存の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:40:34 GMT)
Tuning for the Unknown: Revisiting Evaluation Strategies for Lifelong RL [18.0] ディープRLの標準的なプラクティスは、エージェントの全生涯にわたって、デプロイ環境への未使用のアクセスを仮定することである。
本稿では, 寿命の長いRL研究の進展が, 不適切な経験的手法によって支えられているという考えを考察する。
いずれの手法も1パーセントのチューニングに制限された場合,性能が低下するのに対して,ネットワークの可塑性を維持するために設計されたアルゴリズム的緩和は驚くべき性能を発揮する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:13:22 GMT)
One-dimensional Fermi polaron after a kick: two-sided singularity of the momentum distribution, Bragg reflection and other exact results [17.9] 我々は、ポストキック緩和が終わったときに確立されたポーラロン運動量の分布を計算する。
この分布の顕著な特徴は、2つの過程のうちの1つに対応することができる両側のパワーロー特異点である。
最初のプロセスでは、全てのインパルスは、流体のフォノンのような励起を発生させることなく、ポーラロンに転送される。
第2のプロセスでは、インパルスは流体の中心運動とポラロンの間で共有されるが、流体の励起は生じない。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:51:05 GMT)
Toward Informal Language Processing: Knowledge of Slang in Large Language Models [16.4] 我々は,スラングの自動処理に関連するタスクセットの評価を支援するデータセットを構築した。
評価と微調整の両面で,2つのコアアプリケーションにおけるデータセットの有効性を示す。
GPT-4のようなLCMはゼロショット設定で優れた性能を発揮するが、我々のデータセットで微調整された小さなBERTのようなモデルは同等の性能を得る。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:50:18 GMT)
Transforming LLMs into Cross-modal and Cross-lingual RetrievalSystems [16.3] 大規模言語モデル(LLM)は、ペア化された音声とテキストデータを持つ言語を超えた、テキストのみのデータに基づいて訓練される。
マルチモーダルDEM検索システムの初期化にLLMを使うことを提案する。
本システムは,21言語のみを訓練しながら,102言語で音声とテキストをマッチングできる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:42:28 GMT)
Towards Leveraging AutoML for Sustainable Deep Learning: A Multi-Objective HPO Approach on Deep Shift Neural Networks [16.3] 本研究では,資源消費を最小化しつつ,DSNNの性能を最大化するためのハイパーパラメータ最適化(HPO)の影響について検討する。
実験の結果,提案手法の有効性が示され,精度が80%以上,計算コストが低いモデルが得られた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:03:37 GMT)
A 65nm 8b-Activation 8b-Weight SRAM-Based Charge-Domain Computing-in-Memory Macro Using A Fully-Parallel Analog Adder Network and A Single-ADC Interface [16.2] コンピューティング・イン・メモリ(Computer-in-Memory, CiM)は、メモリ内の多重累積演算を可能にする、有望な緩和手法である。
この研究は、CIFAR-10データセットで88.6%の精度を示しながら、51.2GOPSのスループットと10.3TOPS/Wエネルギー効率を達成する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:58:41 GMT)
What Can Transformer Learn with Varying Depth? Case Studies on Sequence Learning Tasks [15.9] 注意層が1つしかない変圧器は記憶に優れるが、他のタスクでは不足する。
単一注意層が実行可能な単純な操作のクラスを特定し、これらの単純な操作の組み合わせとして、複雑なタスクがアプローチ可能であることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:45:12 GMT)
Predicting the Performance of Foundation Models via Agreement-on-the-Line [15.8] 我々は、異なるデータセットで事前訓練された基礎モデルのアンサンブルが、ライン上での合意を示すことも示している。
多様なアンサンブルを慎重に構築することにより,高精度な基礎モデルのOOD性能を予測するために,コンセンサス・オン・ザ・ライン方式を用いることができる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 00:54:38 GMT)
FAIRM: Learning invariant representations for algorithmic fairness and domain generalization with minimax optimality [15.7] 本研究では,多様性型条件下でのフェアネスと領域一般化特性が望ましい学習環境に基づくオラクルFAIRMを提案する。
線形モデルでFAIRMを実現するための効率的なアルゴリズムを開発し、最小限の最適化で漸近的性能を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:06:25 GMT)
Enchanting Program Specification Synthesis by Large Language Models using Static Analysis and Program Verification [15.7] AutoSpecは、自動プログラム検証のための仕様を合成するための自動化アプローチである。
仕様の汎用性における既存の作業の欠点を克服し、完全な証明のために十分かつ適切な仕様を合成する。
実世界のX509パーサプロジェクトでプログラムを検証するためにうまく適用することができる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:44:02 GMT)
Prompts As Programs: A Structure-Aware Approach to Efficient Compile-Time Prompt Optimization [14.0] 本稿では,メタプロンプトプログラムのコンパイル時最適化のためのフレームワークSAMMOを紹介する。
SAMMOは従来の手法を一般化し,命令チューニングにおける複雑なプロンプト,(2)RAGパイプラインチューニング,(3)プロンプト圧縮の性能を向上させる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:35:54 GMT)
Autonomous Data Selection with Language Models for Mathematical Texts [13.8] 自律的なデータ選択に基礎言語モデルを活用する新しい戦略を導入する。
提案手法では,メタプロンプト言語モデルをゼロショット検証器として利用し,高品質な数学的コンテンツを自律的に評価・選択する。
本手法は,最先端のベースラインに比べて,トークンの事前学習効率が2倍に向上したことを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:17:30 GMT)
Learning CNN on ViT: A Hybrid Model to Explicitly Class-specific Boundaries for Domain Adaptation [13.8] ほとんどのドメイン適応(DA)法は、畳み込みニューラルネットワーク(CNN)または視覚変換器(ViT)に基づいている。
ECB(Explicitly Class-specific boundaries)と呼ばれる,ViTとCNNの両方をフル活用するためのハイブリッド手法を設計する。
ECBは独自の強みを組み合わせるために、ViTでCNNを学びます。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:02:32 GMT)
Can LLMs get help from other LLMs without revealing private information? [13.7] カスケード(Cascade)は、ローカルモデルがユーザのデータをそれ自体でラベル付けできない場合、大規模なリモートモデルをクエリ可能な、一般的なタイプの機械学習システムである。
プライバシ保護技術を用いたローカルモデルを用いて,そのようなシステムにカスケードシステムを適用する可能性を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:49:33 GMT)
The ground state of electron-doped $t-t'-J$ model on cylinders [13.4] ドーピングレベルは1/6ドル,1/8ドル,1/12ドルで,電子ドープカップレートの位相図で最も興味深い領域である。
幅4, 6系では、反強磁性ネイル状態とストライプ状態の間の固定ドーピングスイッチの基底状態が分かる。
この研究で観測された境界条件と大きさに対する基底状態の感度は、$t'$-Hubbardモデルと似ている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:18:24 GMT)
Injecting New Knowledge into Large Language Models via Supervised Fine-Tuning [13.4] 本稿では,Large Language Models(LLMs)における知識注入手法としてのスーパーバイザードファインタニング(SFT)の有効性について検討する。
さまざまなデータセット生成戦略 – トークンベースとファクトベースのスケーリング – を比較して,モデルが新たな情報を学ぶためのトレーニングデータを生成します。
その結果、ドメイン外知識に関連するQ&Aタスクのパフォーマンスが大幅に向上した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:09:45 GMT)
Is Exploration All You Need? Effective Exploration Characteristics for Transfer in Reinforcement Learning [13.3] 我々は、オンライントランスファー学習に肯定的な影響を及ぼす特徴を特定するために、さまざまなトランスファータイプ(またはノベルティ')で11の人気のある探索アルゴリズムをテストする。
分析の結果,特定の環境変化に対してのみ伝達性能が向上するのに対し,その特性は幅広い伝達タスクにおける性能と効率の向上と相関していることがわかった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:45:01 GMT)
An Exploratory Study of the Relationship between SATD and Other Software Development Activities [13.0] Self-Admitted Technical Debt (SATD)は、開発者が負債を思い出させるためにコードをドキュメント化する、特定のタイプのTechnical Debtである。
これまでの研究では、SATDの様々な側面を探求してきた。
本研究ではSATDの削除と追加とバグ修正,新機能の追加,テストなどの活動との関係について検討する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:45:42 GMT)
PhysORD: A Neuro-Symbolic Approach for Physics-infused Motion Prediction in Off-road Driving [12.4] 自動オフロード運転には運動予測が不可欠である。
従来の物理学に基づくアプローチは、力学系と外乱を正確にモデル化することの難しさに直面する。
オフロード運転時の動作予測のためのデータ駆動型ニューラルモデルに保存則を統合するニューラルシンボリックアプローチであるPhysORDを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:36:31 GMT)
Endo-4DGS: Endoscopic Monocular Scene Reconstruction with 4D Gaussian Splatting [12.3] 動的シーン再構築は、下流の作業を大幅に強化し、手術結果を改善することができる。
NeRFベースの手法は、最近、シーンを再構築する異常な能力で有名になった。
本研究では,リアルタイムな内視鏡的動的再構成手法であるEndo-4DGSを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:17:34 GMT)
Meta Prompting for AI Systems [12.3] 本稿では,言語モデル(LM)とAIシステムを利用した問題解決とデータインタラクションの革新的手法であるMeta Prompting(MP)について包括的な研究を行う。
MPは従来のコンテンツ中心の手法よりも情報の構造と構文を強調している。
本稿では,メタプロンプティングの形式的定義を探求し,数発のプロンプトから分離し,さまざまなAIアプリケーションにおけるその効果を裏付ける。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:36:57 GMT)
Cumulative Reasoning with Large Language Models [12.3] 累積推論(CR)は、累積的かつ反復的に言語モデルを利用する新しいアプローチである。
いくつかの複雑な推論タスクを通してCRの優位性を実証する。
CRはMATHデータセットに新しい最先端技術を設定する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:37:39 GMT)
Release of Pre-Trained Models for the Japanese Language [12.3] 日本語で事前学習した生成前変換器(GPT)、コントラスト言語と画像前学習(CLIP)、安定度、HuBERTによる隠れユニット双方向表現(HuBERT)をリリースする。
ユーザーは、日本の文化的価値観と整合し、日本の文化のアイデンティティを保証するAIと自由に対話でき、それによってAIの民主化が促進される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:59:43 GMT)
Large Language Models are Good Prompt Learners for Low-Shot Image Classification [12.1] 本稿では,CLIPテキストエンコーダの適応的なプロンプトを生成するLLaMP,Large Language ModelsをPrompt学習者として提案する。
実験により、LLaMPは他の最先端の素早い学習法と比較して、ゼロショットの一般化と少数ショットの画像分類の両方においてより良い性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:47:35 GMT)
Supporting Mitosis Detection AI Training with Inter-Observer Eye-Gaze Consistencies [11.9] 本研究では、医師の行動データをAIトレーニングのために収集する費用対効果技術としての視線追跡について検討する。
視線データを使用する際の大きな課題の1つは、意味のある情報の抽出を妨げる低信号対雑音比である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:57:35 GMT)
MESEN: Exploit Multimodal Data to Design Unimodal Human Activity Recognition with Few Labels [11.9] MESENはマルチモーダル・エンパワー・ユニモーダル・センシング・フレームワークである。
Mesenは、ラベルのないマルチモーダルデータを利用して、各モーダルに対して効果的なユニモーダル特徴を抽出する。
Mesenは最先端のベースラインよりも大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:54:05 GMT)
Laying Anchors: Semantically Priming Numerals in Language Modeling [11.8] 我々は,任意のコーパスにおいて,そのコーパス内の数値の分布に支配されるアンカーを生成することによって,意味的に素数に戦略を導入する。
学習した埋め込みの数学的基礎の大幅な改善を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 00:02:00 GMT)
The Solution for the CVPR 2023 1st foundation model challenge-Track2 [11.1] 簡単な戦略により,歩行者検索と車両検索の2つのサブタスクに分割する。
歩行者検索タスクでは、IRRAをベースモデルとし、属性ラベルによる知識のマイニングのために属性分類を特に設計する。
最終B板試験では70.9点, 最終B板試験では1位であった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:54:39 GMT)
LLM-ABR: Designing Adaptive Bitrate Algorithms via Large Language Models [11.1] 本稿では,LLM-ABRについて述べる。LLM-ABRは大規模言語モデル(LLM)の生成能力を利用して,適応型アルゴリズム(ABR)を自動設計するシステムである。
LLM-ABRは,ブロードバンド,衛星,4G,5Gなど多様なネットワーク構成で評価される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:43:55 GMT)
Gen4DS: Workshop on Data Storytelling in an Era of Generative AI [11.0] 生成AIの急速な開発は、多くの新しい疑問を引き起こした。
生成AIはどのようにデータストーリーの作成を促進するか?
ストーリーテリングにAIを導入する際の落とし穴とリスクは何か?
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:11:37 GMT)
Octopus v2: On-device language model for super agent [11.0] 本研究は,GPT-4の性能を精度とレイテンシの両方で上回る20億のパラメータを持つデバイスモデルを実現するための新しい手法を提案する。
Llama-7BをRAGベースの関数呼び出し機構で比較すると,レイテンシを35倍に向上する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:01:32 GMT)
Principles from Clinical Research for NLP Model Generalization [11.0] 一般化可能性の基礎を探求し、それに影響を与える要因について検討する。
関係抽出タスクにおけるエンティティ間の距離などの学習がモデルの内部妥当性にどのように影響するかを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:27:12 GMT)
Lewis's Signaling Game as beta-VAE For Natural Word Lengths and Segments [11.0] 創発的コミュニケーション(EC)の主な目標は、統計特性を自然言語と共有する言語を創出することである。
先行する選択がそれらの統計特性に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:53:07 GMT)
The Unreasonable Effectiveness of Random Target Embeddings for Continuous-Output Neural Machine Translation [10.9] 連続出力ニューラルマシン翻訳(CoNMT)は、離散的な次ワード予測問題を埋め込み予測に置き換える。
完全ランダムな出力埋め込みは、特に大きなデータセットにおいて、厳しい事前訓練されたものよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:56:46 GMT)
Semi-Structured Chain-of-Thought: Integrating Multiple Sources of Knowledge for Improved Language Model Reasoning [10.8] 本稿では,テキスト文書からの非構造化知識と知識グラフからの構造化知識とをシームレスに統合する,新しい半構造化プロンプト手法を提案する。
オープンドメイン型マルチホップ質問応答データセットの実験結果から,提案手法が既存の手法を大幅に上回ることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:36:32 GMT)
Diverse Representation Embedding for Lifelong Person Re-Identification [10.8] Lifelong Person Re-Identification (LReID)は、連続したデータストリームから継続的に学習し、複数のカメラで個人をマッチングすることを目的としている。
CNNのバックボーンに基づく既存のメソッドは、異なる視点から各インスタンスの表現を調べるには不十分である。
本稿では、まずLReIDのための純粋なトランスフォーマーを探索するDRE(Diverse Representations Embedding)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:31:41 GMT)
SnAG: Scalable and Accurate Video Grounding [10.6] ビデオにおけるテキスト記述の時間的基盤は、視覚言語学習とビデオ理解において中心的な問題である。
ビデオグラウンドモデルのスケーラビリティに及ぼすクロスモーダル融合の影響について検討する。
我々は、スケーラブルで正確なビデオグラウンドのためのシンプルなベースラインであるSnAGを提示する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:25:04 GMT)
Emergent Abilities in Reduced-Scale Generative Language Models [10.5] 大規模言語モデルはタスク固有の微調整なしで新しいタスクを解くことができる。
この能力は創発的能力と見なされ、数十億のパラメータを持つ大きな言語モデルで主に見られる。
本研究では,そのような創発特性がモデルサイズと厳密に結びついているか,縮小スケールで訓練されたより小さなモデルで示すことができるかを検討する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:00:28 GMT)
Innovations in Neural Data-to-text Generation: A Survey [10.2] このサーベイは、アプローチ、ベンチマークデータセット、評価プロトコルの構造化された検証によって、ニューラルDTGパラダイムの総合的なビューを提供する。
我々は,言語的に有能なシステムの設計だけでなく,公平性と説明責任を示すシステムにも焦点をあてる,DTG研究の有望な道のりを強調した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 00:33:27 GMT)
SCANNER: Knowledge-Enhanced Approach for Robust Multi-modal Named Entity Recognition of Unseen Entities [10.2] 3つのNER変種を効果的に扱えるモデルであるSCANNERを提案する。
SCANNERは2段階構造であり、最初の段階でエンティティ候補を抽出し、知識を得るためにクエリとして使用する。
NERデータセットのノイズの多いアノテーションから生じる課題に対処するために,新しい自己蒸留法を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:05:41 GMT)
Exploring LLMs as a Source of Targeted Synthetic Textual Data to Minimize High Confidence Misclassifications [10.0] 本研究では,データ拡張のための大規模言語モデル (LLM) の利用を,分類タスク中に高い信頼度で誤った予測を行うNLPモデルの問題に対する潜在的な解決策として検討する。
緩和のために、人間またはLLMは、高い信頼性の誤分類の自然言語特性を提供し、合成データを生成し、トレーニングセットを拡張するのに使用される。
本研究では,3つの分類課題に対するアプローチを広範囲に評価し,信頼性の高い誤分類の数を減らし,その効果を実証する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:25:57 GMT)
Discovering Effective Policies for Land-Use Planning with Neuroevolution [9.9] 森林、都市部、農業など、異なる用途の土地がどのように配分されているかは、地球上の炭素収支に大きな影響を及ぼす。
意思決定者が利用できるさまざまな選択肢を効率的に評価できるようにする代理モデルを学ぶことができる。
進化的探索プロセスは、特定の場所に対する効果的な土地利用政策を発見するために使用できる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:35:02 GMT)
A Survey on Large Language Model-Based Game Agents [9.9] ゲームエージェントの開発は、人工知能(AGI)に進む上で重要な役割を担っている
本稿では, LLMをベースとしたゲームエージェントについて, 総合的な視点から概観する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:34:18 GMT)
Fashion Style Editing with Generative Human Prior [9.9] 本研究の目的は,テキスト記述を用いた人間のイメージのファッションスタイルの操作である。
具体的には、生成した人間の先行性を活用し、学習した潜在空間をナビゲートすることでファッションスタイルの編集を実現する。
我々のフレームワークは、抽象的なファッション概念を人間のイメージにプロジェクションし、この分野にエキサイティングな新しいアプリケーションを導入することに成功している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:22:04 GMT)
Octopus: On-device language model for function calling of software APIs [9.8] 大きな言語モデル(LLM)は、高度なテキスト処理と生成能力のために重要な役割を果たす。
本研究は,ソフトウェアAPIの起動において,デバイス上でのLCMを活用するための新たな戦略を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:29:28 GMT)
CMRNext: Camera to LiDAR Matching in the Wild for Localization and Extrinsic Calibration [9.7] CMRNextはカメラ-LIDARマッチングの新しいアプローチであり、センサー固有のパラメータとは独立しており、一般化可能であり、野生で使用することができる。
3つの公開データセットと3つの社内ロボットを含む6つの異なるロボットプラットフォーム上でCMRNextを広範囲に評価した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:42:42 GMT)
DCR: Divide-and-Conquer Reasoning for Multi-choice Question Answering with LLMs [9.6] 大規模言語モデル(LLM)の推論能力を高めるため,DCR(Divide and Conquer Reasoning)を提案する。
まず、信頼性スコア(mathcalCS$)に基づいて質問を2つのサブセットに分類する。
特に,質問を信頼性スコア(mathcalCS$)に基づいて2つのサブセットに分類する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:58:38 GMT)
PEGASUS: Personalized Generative 3D Avatars with Composable Attributes [9.5] 本稿では,モノクロ映像からパーソナライズされた3次元顔アバターを構築する方法を提案する。
提案手法は,合成データベース生成とパーソナライズされた生成アバターの構築の2段階からなる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:27:45 GMT)
Samba: Semantic Segmentation of Remotely Sensed Images with State Space Model [9.4] 本研究では,Sambaという高解像度リモートセンシング画像のためのセマンティックセマンティックセマンティック・セマンティック・フレームワークを提案する。
Sambaはエンコーダ-デコーダアーキテクチャを使用し、Sambaブロックは効率的なマルチレベルセマンティック情報抽出のためのエンコーダとして機能する。
SambaはLoveDAデータセットで非並列のパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:38:16 GMT)
Corpus Considerations for Annotator Modeling and Scaling [9.3] 一般的に使われているユーザトークンモデルは、より複雑なモデルよりも一貫して優れています。
以上の結果から,コーパス統計とアノテータモデリング性能の関係が明らかになった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:27:24 GMT)
Learning Temporal Cues by Predicting Objects Move for Multi-camera 3D Object Detection [9.1] 本稿では,2分岐ネットワークからなるDAP (Detection After Prediction) モデルを提案する。
分岐(i)から現在のオブジェクトを予測する特徴は、予測知識を伝達するために分岐(ii)に融合される。
私たちのモデルはプラグイン・アンド・プレイで使用することができ、一貫したパフォーマンス向上を示します。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:20:47 GMT)
Learning Intersections of Halfspaces with Distribution Shift: Improved Algorithms and SQ Lower Bounds [9.0] Klivans、Stavropoulos、Vasilyanは、分散シフトを伴うテスト可能な学習の研究を始めた。
それらのモデルは、$mathcalD'$に仮定されないという点で、以前のすべての作業から逸脱している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 23:34:39 GMT)
MR-Scout: Automated Synthesis of Metamorphic Relations from Existing Test Cases [9.0] オープンソースソフトウェアプロジェクトのテストケースからMRを自動的に合成するMR-Scoutを提案する。
符号化されたMRの97%以上は、自動テストケース生成に高品質である。
我々の質的研究は、コード化されたMRの55.76%から76.92%が開発者にとって容易に理解可能であることを示している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:20:03 GMT)
DSGNN: A Dual-View Supergrid-Aware Graph Neural Network for Regional Air Quality Estimation [9.0] 既存の大気質推定手法では, 研究領域を不整合格子領域に分割する。
本稿では,地域空気質評価のためのDual-view Supergrid-aware Graph Neural Network (DSGNN)を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:16:57 GMT)
Active Exploration in Bayesian Model-based Reinforcement Learning for Robot Manipulation [8.9] ロボットアームのエンドタスクに対するモデルベース強化学習(RL)アプローチを提案する。
我々はベイズニューラルネットワークモデルを用いて、探索中に動的モデルに符号化された信念と情報の両方を確率論的に表現する。
実験により,ベイズモデルに基づくRL手法の利点が示された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:44:37 GMT)
3D Reconstruction of Interacting Multi-Person in Clothing from a Single Image [8.9] 本稿では,1つの画像からグローバルなコヒーレントなシーン空間上の衣服の多人数インタラクションの形状を再構築する,新しいパイプラインを提案する。
この課題を克服するために、人間の2つの先駆体を完全な3次元形状と表面接触に活用する。
その結果,本手法は既存の手法と比較して完全で,グローバルに一貫性があり,物理的に妥当であることがわかった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:00:30 GMT)
Haina Storage: A Decentralized Secure Storage Framework Based on Improved Blockchain Structure [8.9] ブロックチェーンに基づく分散ストレージは、クラウドサービス上のセキュアなデータストレージを効果的に実現することができる。
しかし、ストレージ容量の低下や効率の低下など、既存のスキームにはまだいくつかの問題がある。
主に4つの側面を含む分散ストレージフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:56:27 GMT)
Efficient Online Unlearning via Hessian-Free Recollection of Individual Data Statistics [8.9] 機械学習は、特定のデータを選択的に忘れることを可能にして、データ所有者の権利を忘れないように努力する。
近年の手法では,2次情報を含む統計データを事前計算し,保存する手法が提案されている。
ほぼ瞬時に学習できるヘッセン自由オンラインアンラーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:54:18 GMT)
LPSNet: End-to-End Human Pose and Shape Estimation with Lensless Imaging [8.8] レンズレス計測から3次元人のポーズや形状を復元する最初のエンドツーエンドフレームワークを提案する。
具体的には、レンズレス計測を復号化するためのマルチスケールレンズレス特徴デコーダを設計する。
また,人間の手足端推定精度を向上させるために,両頭補助補助機構を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:33:31 GMT)
Mixture-of-Depths: Dynamically allocating compute in transformer-based language models [8.8] トランスフォーマーベースの言語モデルは、FLOPを入力シーケンスに均一に展開した。
変換器はシーケンス内の特定の位置にFLOPを動的に割り当てることが可能であることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:28:11 GMT)
Bayesian Floor Field: Transferring people flow predictions across environments [8.7] 本研究では,環境学の知識と人間の軌跡からの観察を組み合わせ,動的に学習する新しい手法を提案する。
歩行者の観察を必要とせずに初期移行モデルを構築するために、被占領者に基づくディープ・フォワードが使用される。
我々は,本モデルがデータ効率を向上し,実大規模環境にまたがる一般化を実現する能力を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:49:07 GMT)
Dissecting Paraphrases: The Impact of Prompt Syntax and supplementary Information on Knowledge Retrieval from Pretrained Language Models [8.6] ConPARE-LAMAは、3400万の異なるプロンプトからなるプローブで、最小限のパラフレーズ間での比較を容易にする。
ConPARE-LAMAは, PLMの知識検索性能に対する統語的形態や意味情報の独立的な影響についての洞察を可能にする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:35:08 GMT)
Social, Legal, Ethical, Empathetic, and Cultural Rules: Compilation and Reasoning (Extended Version) [8.4] SLEEC(社会的、法的、倫理的、共感的、文化的)ルールは、AIベースの自律システムが従うべき規則の定式化、検証、実施を促進することを目的としている。
AIシステムで効果的な使用を可能にするためには、これらのルールを自動推論をサポートする形式言語に体系的に翻訳する必要がある。
本研究ではまず,SLEEC規則の古典論理への翻訳を正当化するSLEEC規則パターンの言語学的解析を行う。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:09:15 GMT)
Learning to Control Camera Exposure via Reinforcement Learning [8.4] 微調整されたカメラの露出は、しばしば重大な故障と性能劣化を引き起こす。
従来のカメラ露光制御法では、複数の収束ステップと時間を要する。
リアルタイム処理中にカメラ露出を迅速に制御する新しいカメラ露出制御フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:53:39 GMT)
An Abundance of Katherines: The Game Theory of Baby Naming [8.3] 乳児命名の競争力が高い分野について検討する。
私たちは、トラクタブルでクリーンなだけでなく、現実世界を完璧に捉えたモデルを作成します。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:45:41 GMT)
Settling Time vs. Accuracy Tradeoffs for Clustering Big Data [7.9] 大規模データセット上でのk-meansおよびk-medianクラスタリングの理論的および実用的な実行限界について検討する。
私たちのコードは公開されており、実験を再現するためのスクリプトがあります。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:31:19 GMT)
PokeLLMon: A Human-Parity Agent for Pokemon Battles with Large Language Models [7.7] 戦術格闘ゲームにおいて,人間の対人性能を実現する最初のLDM型エージェントであるPokeLLMonを紹介する。
オンライン対人戦は、PokeLLMonの人間的な戦闘戦略とジャスト・イン・タイムの意思決定を実証している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:46:35 GMT)
Team UTSA-NLP at SemEval 2024 Task 5: Prompt Ensembling for Argument Reasoning in Civil Procedures with GPT4 [7.6] 本稿では,民事訴訟における民事訴訟処理課題であるSemEval Task 5について紹介する。
本システムでは,GPT4を用いて法的議論を推理するプロンプトベースソリューションを提案する。
システム全体としては、検証データセットの.8095のマクロF1と、最終テストセットの.7315(21チーム中5番目)が生成される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:55:05 GMT)
Integrated quantum communication network and vibration sensing in optical fibers [7.5] 本稿では、ダウンストリーム量子アクセスネットワーク(DQAN)と光ファイバーの振動検出を統合したネットワークアーキテクチャを提案し、実証する。
私たちの統合アーキテクチャは、セキュアな量子通信センサネットワークを構築するための、実用的で費用対効果の高いソリューションを提供します。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:35:20 GMT)
UniBEV: Multi-modal 3D Object Detection with Uniform BEV Encoders for Robustness against Missing Sensor Modalities [7.5] 本稿では、欠落したモダリティに対して堅牢性を実現するために、エンドツーエンドのマルチモーダル3Dオブジェクト検出フレームワークを提案する。
UniBEVはLiDARとカメラ入力に加えて、LiDARのみまたはカメラのみの入力でも再トレーニングなしで動作可能である。
UniBEVと最先端のBEVFusionとMetaBEVを、すべてのセンサー入力の組み合わせでnuScenesで比較する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:57:12 GMT)
A Novel Benchmark for Few-Shot Semantic Segmentation in the Era of Foundation Models [7.4] DINO V2は、様々なデータセットや適応手法において、他のモデルよりも大きなマージンで優れていることを示す。
一方、適応法は得られた結果にほとんど相違がなく、単純な線形プローブはより高度でより計算集約的な代替手段と競合する可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:13:03 GMT)
Interpretable Dimensionality Reduction by Feature Preserving Manifold Approximation and Projection [7.0] achievementMAPは、それらを低次元の埋め込み空間に埋め込むことで、ソースの特徴を保存する。
我々は、桁分類、オブジェクト検出、MNIST対逆例の解釈にdeadMAPを適用した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 00:33:42 GMT)
Fast and Adaptive Questionnaires for Voting Advice Applications [6.9] 本研究は, ユーザの過去の回答に基づいて, その後の質問を選択する適応型アンケート手法を提案する。
2019年のスイス連邦選挙のSmartvoteデータセットを使って、私たちのアプローチを検証しました。
提案手法は,エンコーダとデコーダの両方にIモデルを併用し,質問選択のためのPosteriorRMSE法と組み合わせることで,提案手法の精度を著しく向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:55:50 GMT)
A Tutorial on Gaussian Process Learning-based Model Predictive Control [6.9] 本チュートリアルでは,ガウス過程(GP)とモデル予測制御(MPC)を統合し,複雑なシステムにおける制御の強化を図る。
このチュートリアルの中心的な貢献は、文学におけるGP-MPCの詳細な体系的な数学的定式化である。
挑戦的な地形における移動ロボットの経路追従や混合車両小隊などのロボット制御の実践的応用について論じる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:13:05 GMT)
TSCM: A Teacher-Student Model for Vision Place Recognition Using Cross-Metric Knowledge Distillation [6.9] 視覚的位置認識は、移動ロボットの自律的な探索とナビゲーションにおいて重要な役割を果たす。
既存の手法では、強力だが大規模なネットワークを利用することでこれを克服している。
本稿では,TSCMと呼ばれる高性能な教師と軽量な学生蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:29:41 GMT)
PosterLlama: Bridging Design Ability of Langauge Model to Contents-Aware Layout Generation [6.9] PosterLlamaは、視覚的およびテキスト的に一貫性のあるレイアウトを生成するように設計されたネットワークである。
評価の結果,PosterLlamaは,信頼性とコンテンツ対応レイアウトの生成において,既存の手法よりも優れていることがわかった。
これは、非条件のレイアウト生成、要素条件のレイアウト生成、レイアウトの完了など、非常に汎用性の高いユーザー操作ツールとして機能するなど、非パラレルな範囲の条件をサポートする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:16:55 GMT)
Learning The Likelihood Test With One-Class Classifiers [6.9] 2つの代替確率密度関数 (pdfs) P0 と P1 からランダムに生成される観測を考えると、pdf がどの観測を発生させたかを決定する問題を考える。
P0 pdfが知られているとき、我々は可能性テスト(LT)を使い、その分布を持つサンプルのセットが利用可能であれば、一級分類(OCC)を利用する。
マルチ層パーセプトロンニューラルネットワーク(NN)と1クラス最小二乗サポートマシン(OSVM)モデルでこれが起こることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:37:59 GMT)
Advancing the Search Frontier with AI Agents [6.8] 複雑な検索タスクは、初歩的な事実発見や再定義のサポート以上のものを必要とする。
近年の人工人工知能(AI)の出現は、検索者にさらなる支援を提供する可能性がある。
この記事では、これらの問題とAIエージェントが検索システムの能力のフロンティアをいかに前進させているかを考察する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:22:27 GMT)
Tensorized NeuroEvolution of Augmenting Topologies for GPU Acceleration [6.8] 神経進化(NeuroEvolution of Augmenting Topologies、NEAT)アルゴリズムは、神経進化の分野でかなりの認知を得ている。
本稿では、NEATアルゴリズムのテンソル化手法を導入し、その多様なネットワークトポロジの変換を可能にする。
NEATライブラリは、Gym, Brax, gymnaxなど、さまざまなベンチマーク環境をサポートしている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:20:12 GMT)
Diffusion$^2$: Dynamic 3D Content Generation via Score Composition of Orthogonal Diffusion Models [6.7] 動的3Dコンテンツ作成のための新しいフレームワークであるDiffusion$2を提示する。
私たちのフレームワークは数分で4Dコンテンツを生成できます。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:58:03 GMT)
Optimal probe states for single-mode quantum target detection in arbitrary object reflectivity [6.6] 最適化アルゴリズムを用いて、任意のオブジェクト反射率に対する単一モード連続変数OPSを同定する。
以上の結果から,OPSは特定の条件下では例外なく,ほとんどの反射率シナリオにおいて非ガウス状態であることが示唆された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:38:15 GMT)
Semantic Augmentation in Images using Language [6.6] 本稿では,既存のデータセットを拡張するために生成された画像を利用する手法を提案する。
本稿では,深層学習モデルの領域外一般化能力を改善するために,効果的なデータ拡張のための様々な戦略について検討する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:54:24 GMT)
SPMamba: State-space model is all you need in speech separation [6.6] 状態空間モデルを用いた音声分離のためのネットワークアーキテクチャを提案する。
我々はTF-GridNetモデルを基本フレームワークとして採用し、Transformerコンポーネントを双方向のMambaモジュールで置き換える。
実験の結果,マンバモデルの性能面において重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:04:31 GMT)
CAM-Based Methods Can See through Walls [6.4] CAMに基づくほとんどの解釈可能性法は、重要なスコアを、モデルが見ることができない画像の一部に誤って属性付けることができることを示す。
我々は、画像の下部を使わないよう制約されたVGGライクなモデルを訓練し、画像の見えない部分の正のスコアを観察する。
この挙動は、2つの新しいデータセットで定量的に評価される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:57:30 GMT)
Pretrain, Prompt, and Transfer: Evolving Digital Twins for Time-to-Event Analysis in Cyber-physical Systems [6.2] デジタル双極子(DT)は、CPSの開発、保守、安全かつ安全な運用を支援する効率的な方法として機能することが広く受け入れられている。
しかし、CPSは、新しい機能や更新機能によって頻繁に進化し、対応するDTをCPSと同期させるように要求する。
DTの進化に不確実性を考慮したトランスファー学習を応用した PPT という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:24:30 GMT)
Insights from the Use of Previously Unseen Neural Architecture Search Datasets [6.2] 我々は、一連のNASチャレンジのために作成された8つの新しいデータセットを示す:AddNIST、Language、MultNIST、CIFARTile、Gutenberg、Isabella、GeoClassing、Chesseract。
これらのデータセットと課題は、NAS開発における問題に注意を向け、開発時に未知のデータセット上でモデルがどのように機能するかを著者に検討するよう促すために開発されている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:48:34 GMT)
Software-Defined Cryptography: A Design Feature of Cryptographic Agility [6.2] Crypto-agilityは、新しい暗号アルゴリズムと標準へのアジャイルアップデートを可能にするデザイン機能である。
本稿では,暗号処理の前提条件について検討し,その望まれる設計特徴について述べる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:11:58 GMT)
Rematch: Robust and Efficient Matching of Local Knowledge Graphs to Improve Structural and Semantic Similarity [6.2] 我々は,新しいAMR類似度指標であるrematchを導入し,RAREと呼ばれる構造類似度の評価を行った。
Rematchは構造的類似度で2位、第1位はSTS-BとSICK-Rのベンチマークで1~5ポイントのセマンティック類似度で2位である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:33:00 GMT)
Real, fake and synthetic faces - does the coin have three sides? [6.2] 本稿では, 実像, ディープフェイク像, 合成顔画像の傾向とパターンを新たに検討する。
我々は8つのディープラーニングモデルを導入し、それらのパフォーマンスを分析して、3つの画像のクラスを区別する。
この分析は、顔画像生成のためのより良いアルゴリズムを構築するのに役立つだけでなく、合成、ディープフェイク、および実際の顔画像が実際には3つの異なるクラスであることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:08:26 GMT)
A Generative Deep Learning Approach for Crash Severity Modeling with Imbalanced Data [6.2] 本研究では,条件付きタブラリGANに基づくクラッシュデータ生成手法を提案する。
分類と解釈の性能を推定するために、クラッシュ重大度モデルを用いる。
以上の結果から,CTGAN-RUが生成した合成データを用いた衝突重大度モデリングは,他の再サンプリング法により生成された原データや合成データよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:07:27 GMT)
Separating and Learning Latent Confounders to Enhancing User Preferences Modeling [6.1] 我々は、推薦のための新しいフレームワーク、SLFR(Separating and Learning Latent Confounders for Recommendation)を提案する。
SLFRは、未測定の共同設立者の表現を取得し、ユーザ嗜好と未測定の共同設立者を遠ざけ、反実的なフィードバックを識別する。
5つの実世界のデータセットで実験を行い、本手法の利点を検証した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:31:59 GMT)
FraGNNet: A Deep Probabilistic Model for Mass Spectrum Prediction [5.9] 複合質量スペクトルモデル(C2MS)は、予測されたスペクトルで実ライブラリを増大させることで、検索率を向上させることができる。
我々は,C2MS予測のための新しい確率的手法であるFraGNNetを開発し,高分解能スペクトルを効率的に正確に予測する。
提案モデルでは,予測誤差の観点から最先端性能を実現し,検索ベースMS2Cのツールとして既存のC2MSモデルを上回っている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 23:16:15 GMT)
EGTR: Extracting Graph from Transformer for Scene Graph Generation [5.9] SGG(Scene Graph Generation)は、オブジェクトを検出し、オブジェクト間の関係を予測するための課題である。
本稿では,DETRデコーダのマルチヘッド自己アテンション層で学習した様々な関係から関係グラフを抽出する軽量一段SGGモデルを提案する。
本稿では,Visual Genome と Open Image V6 データセットに対する提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:20:02 GMT)
Great, Now Write an Article About That: The Crescendo Multi-Turn LLM Jailbreak Attack [5.9] 我々は、Crescendoと呼ばれる新しいジェイルブレイク攻撃を導入する。
Crescendoはマルチターンのジェイルブレイクで、一見良心的な方法でモデルと対話する。
我々はChatGPT, Gemini Pro, Gemini-Ultra, LlaMA-2 70b Chat, Anthropic Chatなど,様々な公共システム上でのCrescendoの評価を行った。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:45:49 GMT)
EDTalk: Efficient Disentanglement for Emotional Talking Head Synthesis [5.8] 本稿では, 対話音声生成のための効率的な分散化フレームワーク(EDTalk)を提案する。
本フレームワークは,映像や音声の入力に対して,口形状,頭部ポーズ,感情表現を個別に操作することを可能にする。
EDTalkの有効性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:32:39 GMT)
NEDS-SLAM: A Novel Neural Explicit Dense Semantic SLAM Framework using 3D Gaussian Splatting [5.7] 本稿では,3次元ガウス表現に基づく明示的DenseセマンティックSLAMシステムNEDS-SLAMを提案する。
本研究では,事前学習したセグメンテーションヘッドからの誤推定の影響を低減するために,空間一貫性のある特徴融合モデルを提案する。
我々は,高次元意味的特徴をコンパクトな3次元ガウス表現に圧縮するために,軽量エンコーダデコーダを用いる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:55:28 GMT)
Deciphering the Interplay between Local Differential Privacy, Average Bayesian Privacy, and Maximum Bayesian Privacy [5.6] 我々はベイジアン・プライバシを導入し、LDPとベイジアン・プライバシ・トレードオフに関する新たな洞察を公表した。
私たちの研究は、将来の経験的探索の基盤となるだけでなく、プライバシー保護アルゴリズムの設計を促進することを約束しています。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:28:06 GMT)
CATP: Cross-Attention Token Pruning for Accuracy Preserved Multimodal Model Inference [5.6] 本稿では,高精度なトークンプルーニング手法であるクロスアテンショントークンプルーニング(CATP)を紹介する。
評価では、CATPは既存のトークンプルーニング法と比較して最大12.1倍高い精度を達成する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:35:35 GMT)
Navigating the Post-API Dilemma | Search Engine Results Pages Present a Biased View of Social Media Data [5.5] ソーシャルメディアAPIへのアクセスを中止するという最近の決定は、インターネット研究に有害な影響を及ぼしている。
このデータへのアクセスの欠如は、インターネット研究のポストAPI時代と呼ばれる。
幸いなことに、人気のある検索エンジンは、適切な検索クエリを提供すると、検索結果ページ(SERP)でソーシャルメディアデータをクロール、キャプチャ、サーフェスする手段を持っている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:28:07 GMT)
Event Causality Is Key to Computational Story Understanding [5.2] 本稿では,イベント因果同定のための最初の手法を提案する。
下流のストーリー品質評価タスクでは、特定因果関係は3.6~16.6%の相対的改善をもたらす。
この結果から, 事象因果関係を未然に把握できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:31:59 GMT)
Entanglement Islands from Hilbert Space Reduction [5.1] ヒルベルト空間に残されている全ての状態に対して、その状態が別の部分集合$mathcalR_a$の状態にエンコードされている部分集合$I_a$が存在することを示す。
このようなシステムを自己符号化と呼び、そのようなシステムの絡み合いエントロピーは、新しい島式によって計算されるべきであることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:25:55 GMT)
UINav: A Practical Approach to Train On-Device Automation Agents [5.0] モバイル機器に適合する自動化エージェントをトレーニングするための,デモベースのアプローチであるUINavを提案する。
わずか10のデモでUINavは70%の精度を達成でき、十分なデモで90%以上の精度を達成できる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:25:57 GMT)
Leveraging Digital Perceptual Technologies for Remote Perception and Analysis of Human Biomechanical Processes: A Contactless Approach for Workload and Joint Force Assessment [5.0] 本研究では,産業環境下での人間の動きの分析を目的とした,革新的なコンピュータビジョンフレームワークを提案する。
このフレームワークは、人間の動作の包括的な精査を可能にし、運動パターンや運動データに関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:12:00 GMT)
A Comprehensive Review of Knowledge Distillation in Computer Vision [4.9] 本稿では, 複雑なモデルをより小さく, より単純なものに圧縮する技術である, 知識蒸留研究の現状について検討する。
本稿では,知識蒸留に関する主要な原則と技術の概要を述べるとともに,コンピュータビジョン分野における知識蒸留の応用について概説する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:55:27 GMT)
Robustly estimating heterogeneity in factorial data using Rashomon Partitions [4.8] 我々は、因子空間をプールに分割するために、羅生門分割集合(RPS)を用いる。
RPSは、たとえ実質的に異なる説明を提供するとしても、最大アフターディパーティションの近くに後続値を持つすべてのパーティションを組み込む。
提案手法を,チャリタブルギフトの価格効果,染色体構造(テロメア長),マイクロファイナンス導入の3つの経験的設定に適用した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:53:28 GMT)
Safe Interval RRT* for Scalable Multi-Robot Path Planning in Continuous Space [4.7] 本研究では、競合のない経路を見つけるために、連続空間におけるMRPP(Multi-Robot Path Planning)の問題を考える。
そこで本研究では,各ロボットの衝突のない軌道を検知するサンプリングベースプランナを低レベルに構成する2段階の手法を提案する。
実験結果から,SI-RRT* は少数のサンプルで高速に高品質な解を見つけることができることがわかった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:07:12 GMT)
M2SA: Multimodal and Multilingual Model for Sentiment Analysis of Tweets [4.5] 本稿では,既存のテキスト型Twitter感情データセットを,簡単なキュレーションプロセスを通じてマルチモーダルフォーマットに変換する。
本研究は,研究コミュニティにおける感情関連研究の新たな道を開くものである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:11:58 GMT)
Self-StrAE at SemEval-2024 Task 1: Making Self-Structuring AutoEncoders Learn More With Less [4.4] 補助的な目的として語彙の再構成を含めることで表現品質が向上することを示す。
独立したチャネルの数を増やすことで、埋め込み品質が大幅に向上することを示す。
我々のシステムは、入力データの1000万トークンをゼロから事前訓練することができ、英語、スペイン語、アフリカーンで有効であることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:38:11 GMT)
A neural network-based approach to hybrid systems identification for control [4.3] 本稿では,断片的なアフィン・ダイナミックスを持つハイブリッドシステムを実現するニューラルネットワークアーキテクチャを提案する。
NNベースの手法は,ハイブリッドシステムにおける最先端のシステム識別手法と非常によく似た性能を持つことを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:16:30 GMT)
Effective Malware Detection for Embedded Computing Systems with Limited Exposure [4.0] そこで本研究では,限定的なマルウェアの複数の変異サンプルを生成するコード認識データ生成手法を提案する。
損失最小化は、生成したサンプルが限られたマルウェアを忠実に模倣し、非現実的なサンプルを緩和することを保証する。
提案手法は,最先端技術により得られた精度の約3倍のマルウェアを検知し,90%の精度で検出する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:37:34 GMT)
PATCH -- Psychometrics-AssisTed benCHmarking of Large Language Models: A Case Study of Mathematics Proficiency [3.9] Psycho-AssisTedCHは、大規模(マルチモーダル)言語モデルの既存のベンチマークの限界に対処する。
心理測定に基づくアプローチを採用すると、既存のベンチマークプラクティスに基づく評価結果と異なる評価結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:58:57 GMT)
Voice EHR: Introducing Multimodal Audio Data for Health [3.9] 本報告では、モバイル/ウェブアプリケーションのみを用いて、ガイド付き質問を通じて健康データをキャプチャする新しいデータ型とそれに対応する収集システムを紹介する。
このアプリケーションは最終的に、従来の音声/呼吸機能、音声パターン、意味のある言語から健康の複雑なバイオマーカーを含む音声電子健康記録(ボイスEHR)をもたらす。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:07:22 GMT)
On Automating Video Game Regression Testing by Planning and Learning [3.7] 本稿では,あるゲーム面の回帰テストを自動化する手法とワークフローを提案する。
基本的な考え方は、詳細なゲームログとインクリメンタルアクションモデル学習技術を使用して、フォーマルモデルを維持することである。
本稿では,ワークフローにおけるモデリング専門家の必要性を最小限に抑えるか,あるいは取り除くための第一歩を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:16:14 GMT)
Learning quantum properties from short-range correlations using multi-task networks [3.7] 相関長が一定である多体量子状態の様々な量子特性を予測できるニューラルネットワークモデルを提案する。
このモデルはマルチタスク学習の技術に基づいており、従来のシングルタスクアプローチよりもいくつかの利点があることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:06:26 GMT)
Lifelong Continual Learning for Anomaly Detection: New Challenges, Perspectives, and Insights [3.7] 生涯の異常検出は、より広く検討された分類設定と比較して本質的に異なる課題をもたらす。
まず,生涯学習の複雑さに対処する異常検出手法を設計するための課題と機会を定義する。
第3に,生涯学習の導入によって得られるパフォーマンスのギャップを強調することを目的として,提案した生涯シナリオに対する一般的な異常検出手法を用いた実験を行った。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:01:05 GMT)
Digital Forgetting in Large Language Models: A Survey of Unlearning Methods [3.6] この調査は、大きな言語モデル(LLM)の忘れ方に焦点を当てている。
まず、LLMのコンポーネント、LLMのタイプ、通常のトレーニングパイプラインなど、LLMのバックグラウンドを提供します。
次に,デジタル忘れることの動機,タイプ,望ましい特性について述べる。
第3に,LLMにおけるデジタル忘れへのアプローチを紹介する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:01:18 GMT)
Poro 34B and the Blessing of Multilinguality [3.3] Poro 34Bは、フィンランド語、英語、プログラミング言語の1兆トークンのために訓練された34億のパラメータモデルである。
フィンランド語における既存モデルの能力を大幅に向上するモデルを,多言語学習アプローチにより生成できることが示される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:34:12 GMT)
Guidelines for Cerebrovascular Segmentation: Managing Imperfect Annotations in the context of Semi-Supervised Learning [3.2] 教師付き学習法は、十分な量のラベル付きデータを入力した場合に優れた性能を達成する。
このようなラベルは一般的に、非常に時間がかかり、エラーが発生し、製造コストがかかる。
半教師付き学習アプローチはラベル付きデータとラベルなしデータの両方を活用する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:31:06 GMT)
CMAT: A Multi-Agent Collaboration Tuning Framework for Enhancing Small Language Models [3.2] 厳密にキュレートされた高品質データセットに基づいてトレーニングされたTinyAgentモデルを紹介する。
また,言語エージェントの能力向上を目的とした革新的システムであるCMAT(Collaborative Multi-Agent Tuning)フレームワークを提案する。
本研究では,マルチエージェントシステムと環境フィードバック機構を統合した新しいコミュニケーションエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:07:35 GMT)
CFIR: Fast and Effective Long-Text To Image Retrieval for Large Corpora [3.2] 本稿では,高速かつ効率的な画像検索のための2段階の粗度指数共有検索(CFIR)フレームワークを提案する。
CFIRは、Recall@1000で既存のMLLMを最大11.06%上回り、トレーニング時間と検索時間をそれぞれ68.75%、99.79%削減している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:54:46 GMT)
KazParC: Kazakh Parallel Corpus for Machine Translation [3.1] KazParCは、カザフ語、英語、ロシア語、トルコ語にまたがる機械翻訳用に設計された並列コーパスである。
我々の研究は、Tilmashと呼ばれるニューラルマシン翻訳モデルの開発にも及んでいる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:08:25 GMT)
Visual Deformation Detection Using Soft Material Simulation for Pre-training of Condition Assessment Models [3.0] オープンソースのシミュレーションツールであるBlenderを使用して、機械学習(ML)モデルのための合成データセットを作成することを提案する。
このプロセスでは、専門家情報を形状キーパラメータに翻訳して変形をシミュレートし、変形したオブジェクトと非変形したオブジェクトの両方のイメージを生成する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:58:53 GMT)
HALO: An Ontology for Representing and Categorizing Hallucinations in Large Language Models [2.9] Hallucination Ontology (HALO) はOWLで書かれており、大きな言語モデル(LLM)で見られる6種類の幻覚をサポートしている。
我々は,複数の独立したWebソースに対して帰納的に収集した幻覚を含むデータセットを公開し,このデータセットをモデル化し,有能な質問に答えるためにHALOをうまく利用できることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:55:52 GMT)
AutoTRIZ: Artificial Ideation with TRIZ and Large Language Models [2.8] TRIZリソースと概念の複雑さは、ユーザの知識、経験、推論能力への依存と相まって、その実践性を制限する。
本稿では,大規模言語モデル(LLM)を活用してTRIZ手法の自動化と拡張を行う,人工的思考ツールであるAutoTRIZを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:38:05 GMT)
Understanding Energy Level Structure Using Quantum Rubik's Cube [2.7] この研究は、量子ルービックキューブ行列とベナルカザール・ベルネヴィグ・ヒューズモデルを組み合わせたものである。
量子ルービックキューブ行列の操作をより明確にするために、ジョゼフス環を用いてルービックキューブ拡大の位相グラフを描く。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:18:45 GMT)
Conjugate-Gradient-like Based Adaptive Moment Estimation Optimization Algorithm for Deep Learning [2.7] 本稿では,ディープラーニングのためのCG-like-Adamという新しい最適化アルゴリズムを提案する。
具体的には、ジェネリック・アダムの第1次と第2次モーメント推定の両方を共役次数様に置き換える。
CIFAR10/100データセットに基づく提案アルゴリズムの優位性を示す数値実験を行った。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:57:17 GMT)
Generative AI-Based Text Generation Methods Using Pre-Trained GPT-2 Model [2.6] この研究は自動テキスト生成の領域を掘り下げ、伝統的な決定論的アプローチからより近代的な手法まで様々な手法を探求した。
欲求探索、ビームサーチ、トップクサンプリング、トップpサンプリング、コントラスト探索、および局所的な典型探索の分析を通じて、この研究は各手法の強み、弱み、および潜在的な応用に関する貴重な洞察を与えてきた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:49:53 GMT)
Unified Control Framework for Real-Time Interception and Obstacle Avoidance of Fast-Moving Objects with Diffusion Variational Autoencoder [2.6] 動的環境におけるロボットアームによる高速移動物体のリアルタイムインターセプションは、非常に困難な課題である。
本稿では,動的オブジェクトを同時にインターセプトし,移動障害を回避することで,課題に対処する統一的な制御フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 23:27:36 GMT)
A Holistic Indicator of Polarization to Measure Online Sexism [2.5] ソーシャルネットワークにおけるマノアとフェミニストの議論のオンライン傾向は、オンラインコミュニティにおける性差別のレベルを包括的に測定する必要がある。
この指標は、オンラインコミュニティの政策立案者やモデレーターにとって重要である。
我々は、男性と女性のアイデンティティと男女の個人を対象とする毒性の総合的な指標を提供するモデルを構築した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:00:42 GMT)
Towards a New Configurable and Practical Remote Automotive Security Testing Platform [2.5] 我々は、車両のサイバーセキュリティテストと研究領域におけるいくつかの課題に対処する次世代のテストプラットフォームを提案する。
車両セキュリティエンジニアリングクラウド(VSEC)テストプラットフォームは、効率的な車両サイバーセキュリティテストと高度な(例えば、侵入、ファズ)テストのためのテストベッドへのアクセスを容易にする方法について詳述する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:40:12 GMT)
KTPFormer: Kinematics and Trajectory Prior Knowledge-Enhanced Transformer for 3D Human Pose Estimation [2.5] 我々は、Kinematics Prior Attention (KPA) と Trajectory Prior Attention (TPA) の2つの事前注意モジュールを提案する。
KPAは運動学のトポロジを構築して人体の運動関係をモデル化し、TPAは軌道トポロジを構築し、フレーム間の関節運動のトポロジの情報を学習する。
3つのベンチマーク(Human3.6M、MPI-INF-3DHP、HumanEva)の大規模な実験は、KTPFormerが最先端の手法と比較して優れた性能を発揮することを示している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:15:15 GMT)
Faked Speech Detection with Zero Prior Knowledge [2.4] 本稿では,入力音声を実物または模倣物として盲目的に分類する分類器を開発するニューラルネットワーク手法を提案する。
本稿では,3層を隠蔽し,重層と落層を交互に交互に配置した逐次モデルに基づくディープニューラルネットワークを提案する。
人間の観察者の場合の85%の精度に対して、テストケースの94%の正確な分類が得られた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:58:15 GMT)
A Feature Dataset of Microservices-based Systems [2.4] データセットの設計と開発における粗悪なプラクティスは、マイクロサービスの悪臭と呼ばれる。
適切なオープンソースのマイクロサービス機能データセットがない。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:52:18 GMT)
Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context [2.3] アフリカ語のみに特化して訓練された最初の自己教師型多言語音声モデルを提案する。
このモデルは、サハラ以南のアフリカで話されている21の言語と方言で、6万時間近い未ラベルの音声セグメントから学習された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:43:36 GMT)
"Against the Void": An Interview and Survey Study on How Rust Developers Use Unsafe Code [2.2] Rustは、エイリアスと変更性を制限することで安全性を保証する。
サイクリックエイリアスやマルチオペレーティングといった重要なデザインパターンは、これらの制限を回避しなければならない。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:36:21 GMT)
Using the Empirical Attainment Function for Analyzing Single-objective Black-box Optimization Algorithms [2.1] 実験的達成関数(EAF)は,対象とするECDFに対していくつかの利点がある。
EAFは、関数毎の品質目標を定義する必要はなく、パフォーマンスの違いをより正確に捉え、追加の要約統計を使用することを可能にしている。
EAFのアクセシビリティを容易にするため、IOHanalyzerプラットフォームにモジュールを統合して計算する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:18:22 GMT)
Can My Microservice Tolerate an Unreliable Database? Resilience Testing with Fault Injection and Visualization [2.1] データベースクライアントのフォールトインジェクションの拡張を開発し、Filibusterに統合しました。
我々のツールは、データベースの破壊を体系的にシミュレートし、アプリケーションレジリエンスの包括的なテストと評価を可能にする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:26:04 GMT)
PeersimGym: An Environment for Solving the Task Offloading Problem with Reinforcement Learning [2.0] 計算ネットワークにおけるタスクオフロード戦略の開発と最適化に適した,オープンソースのカスタマイズ可能なシミュレーション環境であるPeersimGymを紹介する。
PeersimGymは、幅広いネットワークトポロジと計算制約をサポートし、TextitPettingZooベースのインターフェイスを統合して、RLエージェントのデプロイを、単体とマルチエージェントの両方で行えるようにしている。
本稿では,分散コンピューティング環境におけるオフロード戦略を大幅に強化するRLベースのアプローチの可能性を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:17:30 GMT)
Precise and Robust Sidewalk Detection: Leveraging Ensemble Learning to Surpass LLM Limitations in Urban Environments [2.0] この研究は、Cityscapes、Ade20k、およびBostonデータセットにおけるモデルのパフォーマンスを評価した。
アンサンブルモデルは個々のモデルよりも優れ、平均インターセクション・オーバー・ユニオン(MIIOU)スコアは93.1%、90.3%、90.6%に達した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:42:32 GMT)
Emergence of Chemotactic Strategies with Multi-Agent Reinforcement Learning [1.9] ケモタキシーの訓練において,強化学習が生物学的システムに対する洞察を与えることができるかどうかを検討する。
各種エージェントの形状,サイズ,水泳速度をシミュレーションし,生物学的水泳選手の身体的制約,すなわちブラウン運動が,強化学習者のトレーニングが失敗する地域につながるかどうかを判定する。
RLの薬剤は、物理的に可能であればすぐに遊泳でき、場合によっては、アクティブスイミングが環境を圧倒する前にも、遊泳が可能であることが判明した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:42:52 GMT)
Multicore DRAM Bank-& Row-Conflict Bomb for Timing Attacks in Mixed-Criticality Systems [1.8] 悪意のあるエンティティは、共有リソースを利用して、クリティカルなアプリケーションに対するタイミングアタックを作成することができる。
本稿では,共有DRAM二重インラインメモリモジュールの理解に焦点をあてて,「バンク・アンド・行衝突爆弾」と命名したタイミング攻撃を発生させた。
8GBのDDR4-2666 DRAMモジュールを搭載した第2世代Intel Xeonプロセッサで実験を行い、そのような攻撃が被害者タスクの実行時間を約150%増加させることを示した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:57:20 GMT)
A Deep Learning-based Pest Insect Monitoring System for Ultra-low Power Pocket-sized Drones [1.8] スマート農業と精密農業は、効率的で持続可能な農業のためのゲームチェンジャー技術である。
小型のパームサイズのドローンは、作物を検査する柔軟なスマートセンサーとして機能し、害虫の早期発生の兆候を探すことができる。
この研究は、2つの超低消費電力のSystem-on-Chipsを備えた新しい垂直統合ソリューションを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:39:54 GMT)
Decoding the Sociotechnical Dimensions of Digital Misinformation: A Comprehensive Literature Review [1.7] このレビューは、SCOPUS、IEEE、ACMデジタルライブラリーによる788の研究から成っており、主要な研究方向と社会技術的課題を合成している。
このマッピングは、誤情報の概念に関する問題を特定し、緩和戦略の欠陥を強調し、ステークホルダーにアプローチする際の課題を議論し、デジタル誤情報の有害な影響を理解し緩和することに関連する様々な社会技術的側面を明らかにする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:09:27 GMT)
Evolution and Efficiency in Neural Architecture Search: Bridging the Gap Between Expert Design and Automated Optimization [1.7] 本稿では,ニューラルネットワーク検索の概要について概説する。
手動設計から自動化された計算駆動アプローチへの進化を強調している。
医療画像や自然言語処理など、さまざまな分野の応用を強調している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:35:04 GMT)
Activation Steering for Robust Type Prediction in CodeLLMs [1.7] CodeLLMsを構文的邪魔者に対してより堅牢にするために、推論時間技術に貢献する。
我々は、徐々に型付けされた言語であるPythonとTypeScriptの型予測タスクに、我々のアプローチを適用した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:44:44 GMT)
Advancements in Point Cloud Data Augmentation for Deep Learning: A Survey [1.6] ディープラーニング(DL)は、ポイントクラウド分析タスクの主流で効果的な方法の1つになっています。
ポイントクラウドデータ拡張方法は、さまざまなポイントクラウド処理タスクで広く利用されている。
本稿では、これらの手法を調査し、基本的および専門的なポイントクラウドデータ拡張手法を含む分類フレームワークに分類する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:14:57 GMT)
FLIGAN: Enhancing Federated Learning with Incomplete Data using GAN [1.6] Federated Learning (FL)は、ネットワークデバイス上での機械学習モデルの分散トレーニングのためのプライバシ保護メカニズムを提供する。
本稿では,FLにおけるデータ不完全性問題に対処する新しいアプローチであるFLIGANを提案する。
本手法はFLのプライバシ要件に則り,プロセス内の実際のデータを共有せずに合成データをフェデレートした方法で生成する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:33:06 GMT)
A Causal Model for Quantifying Multipartite Classical and Quantum Correlations [1.5] 我々は、与えられた複数の古典的あるいは量子的相関の中で情報理論資源の操作的定義を与える。
我々は、古典的な機密性以外にも、分散コンピューティング問題のセキュリティに有用な追加のリソースが存在すると論じている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:26:13 GMT)
One Noise to Rule Them All: Multi-View Adversarial Attacks with Universal Perturbation [1.5] 本稿では,3次元物体認識における頑健な多視点対角的例を生成するために,新しい普遍摂動法を提案する。
単一のビューに制限された従来の攻撃とは異なり、我々のアプローチは複数の2Dイメージで動作し、実用的でスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:29:59 GMT)
Helmsman of the Masses? Evaluate the Opinion Leadership of Large Language Models in the Werewolf Game [1.5] 我々はWerewolfのゲームをシミュレーションプラットフォームとして利用し、大規模言語モデル(LLM)の意見リーダーシップを評価する。
ゲームは保安官の役割を特徴とし、議論を要約し、決定オプションを推奨する。
我々は、意見のリーダーの批判的特徴に基づいて、評価のための2つの新しい指標を考案した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:46:18 GMT)
Atomic magnetometry using a metasurface polarizing beamsplitter in silicon on sapphire [1.4] シリコン・オン・サファイア(SOS)プラットフォーム上に作製した準曲面偏光ビームスプリッタを用いて原子磁気計測を行った。
我々は、非線形磁気光学回転と測定サブナオテスラ感度に基づく原子磁気センサに準曲面を組み込んだ。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:56:40 GMT)
Realtime Person Identification via Gait Analysis [1.3] エッジAIデプロイメントとリアルタイム歩行認識に非常に適した4層を有する小型CNNモデルを提案する。
我々のモデルは96.7%の精度で5KBのRAMしか消費せず、起動時間は70msと125mWである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:15:06 GMT)
A Computational Analysis of Lyric Similarity Perception [1.2] 人間の知覚との類似性をモデル化するための計算手法の比較分析を行う。
以上の結果から,事前学習したBERTモデルからの埋め込み,歌詞が導出される音声,知覚的歌詞の類似性を示す音声成分の類似性に基づく計算モデルが示唆された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:31:38 GMT)
LLMs in the Loop: Leveraging Large Language Model Annotations for Active Learning in Low-Resource Languages [1.1] 低リソース言語は、限られた言語資源とデータラベリングの専門知識のために、AI開発において重大な障壁に直面している。
データアノテーションのアクティブ学習ループにおけるLLMの可能性を活用することを提案する。
GPT-4-Turboを用いた実証的な評価では、データ要求が大幅に削減され、最先端の性能が実証された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:34:22 GMT)
Efficient Syndrome Decoder for Heavy Hexagonal QECC via Machine Learning [1.1] 近年の進歩により、トポロジカルコードは機械学習(ML)技術の展開によって効率的に復号化可能であることが示されている。
まず、ヘキサゴナルコードのためのMLベースのデコーダを提案し、しきい値と擬似閾値の値でその効率性を確立する。
等価なエラークラスを決定するランクに基づく新しい手法が提案され、線形探索に基づくクラスよりも経験的に高速である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:51:00 GMT)
Quantum illumination with noisy probes: Conditional advantages of non-Gaussianity [1.0] 2モードの圧縮真空状態のように絡み合った状態は、照明プロトコルにおいて量子的に有利であることが知られている。
非ガウス光子付加および減光状態は、全方位熱雑音の上の局所ガウス雑音の影響を受け、照明プロトコルのプローブとして用いる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:42:38 GMT)
Systematic Solutions to Login and Authentication Security: A Dual-Password Login-Authentication Mechanism [1.0] 認証盗難とリモート攻撃は、認証メカニズムに対する最も深刻な脅威である。
ユーザの選択した秘密のログインパスワードを,認証不能なパスワードに変換する,デュアルパスワードのログイン認証機構を設計する。
ログインパスワードの認証可能機能と、認証パスワードのタイプ可能な機能とを無効又は無効にすることができ、クレデンシャル盗難やリモート攻撃を防止できる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:05:47 GMT)
JMI at SemEval 2024 Task 3: Two-step approach for multimodal ECAC using in-context learning with GPT and instruction-tuned Llama models [1.0] 本稿では,SemEval-2024タスク3におけるシステム開発について述べる:「会話におけるマルチモーダル感情原因分析の競争」
人間の会話における感情を効果的に捉えるには、テキスト、オーディオ、ビデオなどの複数のモダリティを統合する必要がある。
提案手法は2段階の枠組みでこれらの課題に対処する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:52:37 GMT)
Classification for everyone : Building geography agnostic models for fairer recognition [1.0] 私たちはこのバイアスを2つのデータセット、The Dollar StreetデータセットとImageNetに定量的に提示します。
そして、このバイアスを減らすために様々な方法を提示します。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:12:10 GMT)
Local operator quench induced by two-dimensional inhomogeneous and homogeneous CFT Hamiltonians [0.9] 等角体理論(2d CFTs)における非平衡過程は、不均一および等質ハミルトニアンによって誘導される作用素の成長によるものである。
我々の主な発見は、ホログラフ CFT において、不均一ハミルトニアンによって誘導される非単元時間進化は、単元時間進化よりも長い状態情報を保持することができるということである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:34:49 GMT)
Time Series Analysis in Compressor-Based Machines: A Survey [0.9] 圧縮機ベースの機械は、生産と消費者のニーズを満たすのに不可欠である。
本研究の目的は、FD、FP、予測、CPDといったタスクに関する最近の研究を調査することである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:26:01 GMT)
Short vs. Long-term Coordination of Drones: When Distributed Optimization Meets Deep Reinforcement Learning [0.9] 自律型対話型ドローンの群れは、スマートシティーに魅力的なセンシング機能を提供する。
本稿では,コスト効率の高いナビゲーション,センシング,リチャージのための新しいコーディネートソリューションの提供を目的とする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:35:12 GMT)
COVID-19 Detection Based on Blood Test Parameters using Various Artificial Intelligence Methods [0.7] 2019年には、新型コロナウイルスによる新型コロナウイルス感染症SARS-CoV-2(SARS-CoV-2)という新たな課題に直面した。
本研究は、自己分類分類器を用いて、さまざまなAI手法を用いて、新型コロナウイルス患者と他者とを区別することを目的とした。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:49:25 GMT)
Global Mapping of Exposure and Physical Vulnerability Dynamics in Least Developed Countries using Remote Sensing and Machine Learning [0.7] 本研究の目的は,気候・災害リスクの低減に向けた長期的集団的取り組みを報知する上で,大規模リスク定量化の分野を推し進めることである。
本稿では,現在公開されているSentinel-1 SAR GRDとSentinel-2 Harmonized MSIから,機械学習と時系列リモートセンシングを用いて,この重要な情報をマッピングする作業を行っている。
我々は,ほとんど開発されていない(LDC)47か国からなる「OpenSendaiBench」の開発を紹介し,ResNet-50ディープラーニングモデルを訓練し,バングラデシュのダッカ地方を実演した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:04:56 GMT)
BioImage.IO Chatbot: A Community-Driven AI Assistant for Advanced Bioimage Analysis and Tool Integration [0.7] Bio$Image.$IOは、Large Language Modelsによって支えられ、コミュニティ主導の知識ベースとツールによって強化されたAIアシスタントである。
データ検索からAI強化分析に至るまで、フレキシブルな拡張メカニズムを通じて、ユーザ要求の範囲でカスタマイズされたインタラクションを容易にする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:48:39 GMT)
Passive and Deterministic Controlled-phase Gate for Single-photon Wavepackets Based on Time-reversal Symmetric Photon Transport [0.7] 単光子ウェーブパケットに対する受動的,決定論的,ほぼ一元整合性制御-$pi$相ゲートの構築について報告する。
提案されたゲートは、時間反転対称光子輸送の原理に根ざしている。
非線形媒体を用いたフォトニック位相ゲートに固有のウェーブパレット歪みの長年の問題を回避することができる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:50:40 GMT)
Breaking the Silence Detecting and Mitigating Gendered Abuse in Hindi, Tamil, and Indian English Online Spaces [0.7] チームCNLP-NITS-PPは、CNNとBiLSTMネットワークを組み合わせたアンサンブルアプローチを開発した。
CNNは、組み込み入力テキストに適用される畳み込みフィルタを通じて、乱用言語を表す局所的な特徴をキャプチャする。
BiLSTMは、単語とフレーズ間の依存関係について、このシーケンスを解析する。
評価スコアはf1尺度、特に英語0.84に対して高い性能を示した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:55:47 GMT)
Leveraging Recommender Systems to Reduce Content Gaps on Peer Production Platforms [0.6] 提案する記事の提示は,記事に対する作業の割合を増大させるが,全体としてのレコメンデーションの取り込みは著しく減少する。
論文発見プロセスの無視が、ピアプロダクションプラットフォームにおける推奨事項を人工的に限定することを含む、結果の意味について論じる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:56:53 GMT)
Solving the $KP$ problem with the Global Cartan Decomposition [0.6] 本稿では,Frakp$ で $-iH(t) を制御したターゲット $-iX in [frakp,frakp] サブセット frakk$ の時間最適ユニタリを生成する新しい手法を提案する。
dTheta$の仮定は、変動的手法を用いて解析的に解ける時間最適ユニタリ制御問題と等価であることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 23:03:16 GMT)
Computational limits to the legibility of the imaged human brain [0.5] 構造的および機能的データから25個の生物特性の予測可能性を評価する。
性別の高い予測可能性(精度99.7%)、年齢(平均絶対誤差2.048年、R2 0.859)、体重(平均絶対誤差2.609Kg、R225)は、新しい最先端性能と、他の特性の驚くほど低い予測可能性との間に相違があることを見出した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:12:46 GMT)
Making Privacy-preserving Federated Graph Analytics with Strong Guarantees Practical (for Certain Queries) [0.5] 本稿では、ネットワーク転送において、数分の時間とわずかなMIBを必要とするプライバシー保護グラフ分析システムについて、低コストで提案する。
Coloの実装と評価により、人口100万のデバイス上でさまざまなCOVID-19クエリを実行するには、デバイスのCPU時間8.4分未満、ネットワーク転送では4.93 MiBsが必要であることが示されている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:01:31 GMT)
MAgNET: A Graph U-Net Architecture for Mesh-Based Simulations [0.5] 我々は、任意のグラフ構造化データに対応するために、よく知られた畳み込みニューラルネットワークを拡張するMagNETを提案する。
固体の力学における非線形有限要素シミュレーションのサロゲートモデリングにおけるMAgNETの予測能力を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:22:26 GMT)
Multitask-based Evaluation of Open-Source LLM on Software Vulnerability [0.4] 本稿では,公開データセットを用いた対話型LCMの定量的評価パイプラインを提案する。
我々は,4つの共通ソフトウェア脆弱性タスクをカバーするBig-Vulを用いて,LLMの広範な技術的評価を行う。
既存の最先端手法は、ソフトウェア脆弱性検出において、LLMよりも一般的に優れていることが判明した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:52:05 GMT)
Generalizable, Fast, and Accurate DeepQSPR with fastprop Part 1: Framework and Benchmarks [0.4] 本稿では,DeepQSPRフレームワークであるFastpropを紹介した。このフレームワークは,分子レベル記述子のコジェントなセットを用いて,多様なデータセット上での学習表現の性能を劇的に向上させる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:57:32 GMT)
Classifying Cancer Stage with Open-Source Clinical Large Language Models [0.4] オープンソースの臨床大言語モデル(LLMs)は、実世界の病理報告から病理組織学的腫瘍-リンパ節転移(pTNM)のステージング情報を抽出することができる。
以上より, LLMは腫瘍 (T) 分類においてサブパーパフォーマンスを示すが, プロンプト戦略の適切な適用により, 転移 (M) では同等の性能を示し, Node (N) 分類では性能が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:30:47 GMT)
What Blocks My Blockchain's Throughput? Developing a Generalizable Approach for Identifying Bottlenecks in Permissioned Blockchains [0.3] 許可されたブロックチェーンのボトルネックを特定するための、より統一的でグラフィカルなアプローチを開発しています。
Hyperledger FabricとQuorumという2つの広く使用されているパーミッションブロックチェーンについて、詳細なケーススタディを実施しています。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:00:50 GMT)
Immature Green Apple Detection and Sizing in Commercial Orchards using YOLOv8 and Shape Fitting Techniques [0.3] 本研究は,3次元点雲データ上の幾何形状整合技術と合わせて,最先端のYOLOv8オブジェクト検出とインスタンス分割アルゴリズムを用いた。
この手法は2つのRGB-Dセンサー、Intel RealSense D435iとMicrosoft Azure Kinect DKを利用した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:35:46 GMT)
Towards Better Understanding of Cybercrime: The Role of Fine-Tuned LLMs in Translation [0.3] 我々は,サイバー犯罪言語のニュアンスを正確に捉えることができる翻訳を生成するために,細調整のLarge Language Models (LLM) を提案する。
我々は,ロシア語を話すハクティビストグループNoName05716の公開チャットに適用する。
提案手法は, 高忠実度翻訳が可能であり, 翻訳者に比べて430~23,000のコスト削減が可能であることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:33:23 GMT)
A Lightweight Security Solution for Mitigation of Hatchetman Attack in RPL-based 6LoWPAN [0.2] IoT(Internet of Things, モノのインターネット)は業界で大きく成長し、業界 4.0 の時代を生きている。
従来のルーティング手法は、限られたリソースデバイス、損失のあるリンク、遅いデータレートを持つネットワークでは効果がない。
本稿では、攻撃者が低電力・ロッシーネットワークのためのルーティングプロトコル(RPL)の非ストレージ機能を利用する場合、ネットワーク性能の大幅な低下を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:48:33 GMT)
Symmetry Resolution in non-Lorentzian Field Theories [0.2] 特に、先行順序項、対数項、$mathcalO(1)$項を計算する。
キャロル極限に対するSREEのホログラフィック原点を念頭に置いて、BMS$_3$-Kac-Moody に対するSREEをさらに計算する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:01:05 GMT)
Moodle Usability Assessment Methodology using the Universal Design for Learning perspective [0.2] 本研究の目的は,ユニバーサル・デザイン・フォー・ラーニングの原則に基づいて,Moodleプラットフォームのユーザビリティを評価する手法を設計することである。
我々は、それぞれのMoodle v.2.xとv.3.xファミリーのバージョンの2つのインスタンスを評価するユースケースの結果を提供する。
我々は、国際アクセシビリティ標準に準拠するために、プラットフォームがいくつかの重要な要素を改善しなければならないと結論付けている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:25:51 GMT)
Efficient, indistinguishable telecom C-band photons using a tapered nanobeam [0.2] InAs/InP量子ドットをテープ状ナノビームに結合した電気通信Cバンドに効率よくファイバカップリングした単一光子源を実演する。
この研究は、明るく、純粋で、識別不能な光子を放出する通信用Cバンド単光子源の開発に向けた重要なステップである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:56:33 GMT)
Towards a Completeness Argumentation for Scenario Concepts [0.2] 本稿では,目標構造表記を用いたシナリオ概念の完全性について論じる。
シナリオの概念とinDデータセットにメソッドを適用して、ユーザビリティを証明する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:29:38 GMT)
Bayesian neural networks via MCMC: a Python-based tutorial [0.2] 変分推論とマルコフ連鎖モンテカルロサンプリング法を用いてベイズ推定を行う。
このチュートリアルはPythonのコードに、その使用と拡張を可能にするデータとインストラクションを提供する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:38:25 GMT)
Remote sensing framework for geological mapping via stacked autoencoders and clustering [0.2] 地形単位のマッピングのための次元縮小とk平均クラスタリングのために積み重ねられたオートエンコーダを用いて、リモートセンシングデータを処理するための教師なし機械学習フレームワークを提案する。
本研究により, 岩盤単位を効率的に識別し, 高精度かつ解釈可能な地質図を作成できることが判明した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:15:32 GMT)
Artificial Intelligence for the Internal Democracy of Political Parties [0.1] この記事は、AIが政党内における民主的プロセスの測定と実施を強化することを主張している。
形式的パラメータや自己報告データ、調査のようなツールに依存することが多いIDDを測定する従来の方法の限界を特定します。
記事は、データプライバシに関する懸念、操作の可能性、テクノロジへの過信の危険性など、IDDのための機械学習の主なリスクについて考察することで、結論付けている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:59:23 GMT)
Zero-shot Safety Prediction for Autonomous Robots with Foundation World Models [0.1] 世界モデルは、コントローラを訓練し、システムの内部のダイナミックモデルを学ぶことによって安全違反を予測するために代理世界を作成する。
本稿では,観察を意味的かつ因果的に潜伏した表現に組み込む基礎世界モデルを提案する。
これにより、Surrogate dynamicsは、トレーニング不要な大規模言語モデルを活用することで、因果先状態を直接予測できる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:39:26 GMT)
Why is the universe not frozen by the quantum Zeno effect? [0.0] 本研究では,2レベルシステムの自由内部進化と周囲環境によるデコヒーレンスとのユビキタスな競合をシミュレートするモデルを構築した。
これにより、短時間のデコヒーレンスレベルによって分析的基準が導かれ、ゼノ効果によりシステムが凍結するかどうかが決定される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:00:19 GMT)
When does Subagging Work? [0.0] 回帰木に対するサブアグリゲーションまたはサブスタンプアグリゲーションの有効性について検討した。
i) バイアスは細胞の直径に依存するので、分裂が少ない木はバイアスを受ける傾向にあると定式化します。
サブゲージの性能を,異なる数の分割木と比較した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:44:55 GMT)
When Abel Kills Cain: What Machine Translation Cannot Capture [0.0] 記事は、構造の観点から、AIベースの自動翻訳装置が完全に捕捉できないものを特定することを目的としている。
原因を説明するために、機械のミスに焦点を当てる。
カインとアベルの聖書の物語は、その豊かで批判的な解釈の伝統のために選ばれた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:46:00 GMT)
What is to be gained by ensemble models in analysis of spectroscopic data? [0.0] 分光データの予測を改善することを目的としたアンサンブルモデルの異なる実装を比較するための実験的検討を行った。
線形混合モデルを用いた統計的解析は、データのランダムな分割に対するモデル適合から得られる予測性能基準に基づいて行われた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:28:59 GMT)
Using Large Language Models for (De-)Formalization and Natural Argumentation Exercises for Beginner's Students [0.0] 現在開発中の2つのシステムは、自然言語と命題論理と一階述語論理の言語を相互に翻訳する際の(i)エクササイズの自動修正に大規模な言語モデルを使用している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:34:15 GMT)
Upsample Guidance: Scale Up Diffusion Models without Training [0.0] 事前学習した拡散モデルを適用して高解像度画像を生成する手法であるアップサンプルガイダンスを導入する。
注目すべきは、このテクニックは追加のトレーニングや外部モデルへの依存を必要としないことだ。
アップサンプルガイダンスは,画素空間,潜時空間,ビデオ拡散モデルなど,様々なモデルに適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 07:49:08 GMT)
Tunneling time, the barrier time-delay and weak measurement What was or can actually be measured with the Attoclock? [0.0] 断熱型トンネル電離の時間遅れと非断熱型トンネル電離の時間遅れの差から,バリアの時間遅れを合理的に定義し,決定できることを示す。
弱い測定限界では、バリアの時間遅延はラーモア時計時間とバリア内の相互作用時間に対応する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:45:11 GMT)
Transformer meets wcDTW to improve real-time battery bids: A new approach to scenario selection [0.0] 本稿では,重み付き制約付き動的時間ワープを用いたトランスフォーマーに基づく予測手法を提案する。
提案手法はトランスフォーマーの予測能力を利用してエネルギー価格を予測し,wcDTWは関連する歴史的シナリオの選択を保証する。
提案手法は従来の方法に比べて10%の収益増加を示し,リアルタイム市場におけるバッテリ入札戦略に革命をもたらす可能性を強調した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:30:54 GMT)
Transcribing Bengali Text with Regional Dialects to IPA using District Guided Tokens [0.0] 本稿では,バングラデシュの6つの地区にまたがる新しいデータセットについて,DGT(District Guided Tokens)技術を紹介する。
DGTテクニックは、この新しいデータセットに基づいて、いくつかのトランスフォーマーベースのモデルを微調整する。
ByT5モデルを用いたDGTの有効性を示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:15:36 GMT)
Towards Enhanced Analysis of Lung Cancer Lesions in EBUS-TBNA -- A Semi-Supervised Video Object Detection Method [0.0] 本研究は気管支内視鏡内視鏡(EBUS)を用いた肺病変診断システムの構築を目的とする。
EBUS-TBNA (EBUS-transbronchial needle aspiration) 術中、医師は病変の位置をグレースケールの超音波画像に頼っている。
これまでの研究では、EBUS-TBNAへのオブジェクト検出モデルの適用が欠けており、EBUS-TBNAデータセットに注釈をつけるための明確な解決策は存在していない。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:23:21 GMT)
Time-dependent Rabi frequencies to protect quantum operations on an atomic qutrit by continuous dynamical decoupling [0.0] 本研究では,原子クォートリット上の量子ゲートの作用を保護できるプロシージャに係わる時間依存ラビ周波数に必要な形状について検討する。
いくつかのシミュレーションは、ランダムに選択されたものを含む量子ゲートモデルの作用を保護すると考えられている。
本稿では,3要素の置換のパリティを識別できるアルゴリズムの適用をノイズから保護するために,本手法を適用した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:43:36 GMT)
Theory of Multimode Squeezed Light Generation in Lossy Media [0.0] 損失媒体で発生する多重モード励起光の特性を記述するための統一的理論的アプローチを示す。
ガウス状態の重要なクラスについて、2階相関関数のマスター方程式を導出する。
ブロードバンドモードを導入するための様々な技術や戦略を考えることができる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:16:29 GMT)
The use of the open innovation paradigm in the public sector: a systematic review of published studies [0.0] オープンなイノベーションパラダイムの使用は、ここ数年、公共セクターで特に注目を集めてきた。
このパラダイムの使用が2013年以降,高い頻度で報告されるようになったことは確認できた。
また、ソーシャルメディアによるオープンイノベーションの利用が、公共セクターと市民の間のエンゲージメントの先駆的手法の1つであることも確認できた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:33:34 GMT)
The Ballmer Peak: An Empirical Search [0.0] Ballmer Peak」の概念は2007年に初めて提案され、超人的プログラミング能力を示す非常に特殊な血液アルコール含量が存在すると仮定した。
コーディング能力評価のための業界標準を用いて,このようなピークを探索し,アルコールの量の違いがパフォーマンスに与える影響を概観した。
p 0.001では、少量のアルコール(わずか2杯)がプログラミング能力に有意な効果があることが判明した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:16:23 GMT)
Synthetic Data for Robust Stroke Segmentation [0.0] ディープラーニングに基づくニューロイメージングにおけるセマンティックセグメンテーションは、現在、高解像度スキャンと広範な注釈付きデータセットを必要とする。
そこで我々は,既存のSynthSegアプローチの能力を拡張した,病変分割作業のための新しい合成フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:42:29 GMT)
Supervised Autoencoder MLP for Financial Time Series Forecasting [0.0] この調査は2010年1月1日から2022年4月30日までの取引資産としてS&P500指数、EUR/USD、BTC/USDに焦点を当てている。
具体的には、シャープとインフォメーション比を用いて、ノイズ増大と三重障壁ラベルがリスク調整されたリターンに与える影響を具体的に調べる。
その結果、教師付きオートエンコーダは、バランスの取れたノイズ増大とボトルネックサイズにより、戦略の有効性を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:44:37 GMT)
Study on quantum thermalization from thermal initial states in a superconducting quantum computer [0.0] 本稿では,量子物理学における熱状態の生成問題に対処する手法を提案する。
我々は、IBM量子デバイスを用いたアプローチを実験的に検証し、IBM量子ビットの予測どおり、クエンチの非使用緩和結果を提供する。
この実験は、量子物理学における熱状態と熱化の研究を合理化できることを示すものである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:59:50 GMT)
Spread complexity for measurement-induced non-unitary dynamics and Zeno effect [0.0] 拡散複雑性と拡散エントロピーを用いた非単位量子力学の研究を行う。
非エルミート的ハミルトニアンに対しては、クリロフ基底のビランツォス構成をシュリンガー図形に拡張する。
複素対称ハミルトニアンに適応したアルゴリズムを実装した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:00:27 GMT)
Spectral stability of V2 centres in sub-micron 4H-SiC membranes [0.0] 炭化ケイ素のカラーセンターは、有望な半導体量子技術プラットフォームとして出現する。
シリコン空孔中心は, サブミクロンシリコン炭化物膜に統合できることが示されている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:58:00 GMT)
Risks from Language Models for Automated Mental Healthcare: Ethics and Structure for Implementation [0.0] 本稿では、自律性のレベルを規定し、倫理的要件を概説し、AIエージェントに最適なデフォルト動作を定義する構造化フレームワークを提案する。
また、16のメンタルヘルス関連質問を用いた10の最先端言語モデルの評価を行った。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:05:06 GMT)
ResNet with Integrated Convolutional Block Attention Module for Ship Classification Using Transfer Learning on Optical Satellite Imagery [0.0] 本研究では,高分解能光リモートセンシング衛星画像を用いた船舶の効率的な分類のための新しい移動学習フレームワークを提案する。
このフレームワークは深層畳み込みニューラルネットワークモデルResNet50をベースにしており、CBAM(Convolutional Block Attention Module)を組み込んでパフォーマンスを向上させる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:48:46 GMT)
Reaching Curzon-Ahlborn limit in linear response and Whitney limit in nonlinear response in edge mode quantum thermoelectrics and refrigeration [0.0] 最大出力での効率は、QHとQSHの両方のセットアップにおいてカーゾン=アルボーン限界に近づいた。
線形および非線形輸送系における熱電効率の限界は、量子点接触により初めて達成される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:23:34 GMT)
Quantum bistability at the interplay between collective and individual decay [0.0] キャビティ内に置かれた原子集合体の集団放射について検討した。
これらの状態の1つは絡み合っていて、コヒーレントに放射されるスピン状態とよく似ている。
注目すべきは、この系が個々の崩壊を関連づけた状態でも、絡み合ったCRSSのような状態にあることを示唆している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:44:45 GMT)
Propensity Score Alignment of Unpaired Multimodal Data [0.0] マルチモーダル表現学習技術は通常、共通の表現を学ぶためにペア化されたサンプルに依存する。
本稿では,マルチモーダル表現学習において,異なるモダリティにまたがるアンペア化サンプルの整列化という課題に対処するアプローチを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:36:21 GMT)
Preuve de concept d'un bot vocal dialoguant en wolof [0.0] 本稿では,Wolof言語で構築された最初の自動音声アシスタントのコンセプト実証について述べる。
ボイスボットの目的は、オレンジセネガルのサルガル忠誠プログラムに関する情報を提供することである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:53:41 GMT)
Postprocessing of point predictions for probabilistic forecasting of electricity prices: Diversity matters [0.0] 本稿では,3つのポストプロセッシング手法を用いて,点予測を確率的に変換する手法について検討する。
その結果,予測分布と他の2つの手法を組み合わせることで,約7.5%の改善が得られた。
注目すべきは、この組み合わせのパフォーマンスが、最先端の分散ディープニューラルネットワークと同等であることだ。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:50:36 GMT)
Physics-Informed Graph Neural Network for Dynamic Reconfiguration of Power Systems [0.0] 動的再構成(DyR)は信頼性のあるグリッドを維持するための問題である。
DyRは混合整数問題であり、大きなグリッドや高速な時間スケールで解くことができる。
DyRに適した物理インフォームドグラフニューラルネットワーク(GNN)フレームワークであるGraPhyRを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:44:34 GMT)
Photonic quantum walk with ultrafast time-bin encoding [0.0] 超高速な時間ビン符号化方式を用いて量子ウォークを行う新しいプラットフォームを提案する。
このプラットフォームは、多くのステップに量子ウォークのスケーラビリティをサポートしながら、かなりのプログラム可能性を維持している。
我々の18段階QWは50時間にわたって干渉位相安定性を保っている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:49:16 GMT)
Pairwise Similarity Distribution Clustering for Noisy Label Learning [0.0] ノイズラベル学習は、ノイズラベルを持つ大量のサンプルを使用してディープニューラルネットワークをトレーニングすることを目的としている。
トレーニングサンプルを1つのクリーンなセットと別のノイズのあるセットに分割する,単純で効果的なサンプル選択アルゴリズムを提案する。
CIFAR-10、CIFAR-100、Clothing1Mといった様々なベンチマークデータセットの実験結果は、最先端の手法よりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:30:22 GMT)
On Stronger Computational Separations Between Multimodal and Unimodal Machine Learning [0.0] マルチモーダル機械学習は、大規模な経験的成功(例えば、GPT-4)を享受した
本稿では,マルチモーダル学習理論モデルと一助学習理論モデルとの分離の可能性を検討する。
自然条件下では、任意の計算分離が対応する暗号鍵合意プロトコルを意味することを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:21:28 GMT)
OFMPNet: Deep End-to-End Model for Occupancy and Flow Prediction in Urban Environment [0.0] 環境中の全ての動的オブジェクトの将来の挙動を予測するために,エンド・ツー・エンドのニューラルネットワーク手法を提案する。
本稿では, 終点誤差の大幅な低減を図った新しい時間重み付きモーションフロー損失を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:37:58 GMT)
MedMamba: Vision Mamba for Medical Image Classification [0.0] 医用画像分類のためのビジョンマンバ(メドマンバ)を提案する。
新しいConv-SSMモジュールは、畳み込み層の局所的な特徴抽出能力と、長距離依存性をキャプチャするSSMの機能を組み合わせる。
私たちの知る限りでは、Vision Mambaは医療画像分類用に作られた最初のVision Mambaだ。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:11:45 GMT)
Long-range correlations of the stress tensor near the Cauchy horizon [0.0] 我々は、Reissner-Nordstr"om-de Sitter 時空上の実スカラー量子場の応力テンソルが、コーシー地平線近傍のマクロ距離に相関していることを示す。
これはコーシー地平線付近の半古典近似の分解を示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:33:44 GMT)
Leveraging Machine Learning for Early Autism Detection via INDT-ASD Indian Database [0.0] 自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、世界最速の発達障害の一つである。
本研究は,機械学習を用いてASDを識別するための簡易かつ迅速かつ安価な技術を開発することを目的とした。
Adaboost (AB), Gradient Boost (GB), Decision Tree (DT), Logistic Regression (LR), Random Forest (RF), Gaussian Naive Bayes (GNB), Linear Discriminant Analysis (LDA), Quadratic Discriminant Analysis (QDA), K-Nearest Neighbors (KNN), Support Vector Machine (SVM)など,さまざまな機械学習分類器がある。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:44:51 GMT)
LLMs as Writing Assistants: Exploring Perspectives on Sense of Ownership and Reasoning [0.0] 執筆におけるオーナシップの感覚は、思考、時間、貢献の投資を制限し、アウトプットへのアタッチメントにつながります。
すべてのタスクが同等であっても、創造的なタスクでは、LLM(Large Language Models)を信用する傾向があります。
我々は,これらの問題を調査し,その基礎となる認知過程を理解して,書面における人間とコンピュータの相互作用についてより深い知識を得るための簡単な調査を行う。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:40:21 GMT)
Kallaama: A Transcribed Speech Dataset about Agriculture in the Three Most Widely Spoken Languages in Senegal [0.0] Kallaamaプロジェクトは、音声技術開発のための国語コーパスの作成と普及を目的としている。
プロジェクトはセネガル人の主要言語であるWolof、Pulaar、Sereerの3つに焦点を当てている。
上記各言語における農業に関する125時間の記録を含む音声データセットを作成した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:31:14 GMT)
Investigating Markers and Drivers of Gender Bias in Machine Translations [0.0] 大型言語モデル(LLM)におけるインプシット性バイアスは、文書化された問題である。
我々は、DeepL翻訳APIを使用して、56のソフトウェアエンジニアリングタスクを繰り返し翻訳する際に生じるバイアスを調査する。
いくつかの言語は、類似した代名詞の使用パターンを示し、3つの緩いグループに分類する。
文中に出現する主動詞は,翻訳における意味のあるジェンダーの要因である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:07:39 GMT)
Intrusion Tolerance for Networked Systems through Two-Level Feedback Control [0.0] サービスレプリカを2段階最適制御問題とするシステムの侵入耐性を定式化する。
ローカルレベルではノードコントローラが侵入回復を行い、グローバルレベルではシステムコントローラが複製係数を管理する。
この定式化に基づいて、侵入耐性システムのための新しい制御アーキテクチャであるTOLERANCEを設計する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:00:45 GMT)
Interplay between the Lyapunov exponents and phase transitions of charged AdS black holes [0.0] ダイオニクス、バーディーン、ガウス・ボネット、ローレンツ対称性が巨大な重力ブラックホールを破ると考えている。
我々は、ブラックホールに近い不安定な円形測地学において、質量を持たない粒子と質量を持つ粒子のリャプノフ指数を計算する。
Lyapunov指数の温度分布は、小さなブラックホール相と大きなブラックホール相で異なる挙動を示すことが判明した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:45:46 GMT)
Ink and Individuality: Crafting a Personalised Narrative in the Age of LLMs [0.0] LLMベースの筆記アシスタントへの依存が高まると、創造性と個性は時間とともに悪化する。
本研究は,様々な視点と概念を探索するための簡単な調査を行うことにより,これらの懸念について検討する。
これらの課題に対処することは、人間とコンピュータのインタラクションシステムを改善し、パーソナライズとパーソナライズのためのアシスタントを書くために不可欠である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:42:05 GMT)
Individual-Ion Addressing and Readout in a Penning Trap [0.0] 永久磁石ペニングトラップ内の固回転平面結晶にイオンの個別配置と読み出しを実装した。
平行読み出し用回転フレームには、トラップされたイオン蛍光が検出される。
結晶の中心付近および大きな半径付近でのイオンのアドレス化を実証した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:03:57 GMT)
Improving the Diproche CNL through Autoformalization via Large Language Models [0.0] Diprocheシステムは、ドイツ語の制御された断片で書かれたテキストの自動証明チェッカーである。
本稿では,Diprocheの文脈において,大規模言語モデルによる自己形式化の促進の可能性について検討する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:29:58 GMT)
Improved model-free bounds for multi-asset options using option-implied information and deep learning [0.0] 我々は、依存の不確かさと依存構造に関する追加情報を組み合わせた設定において、マルチアセストオプションに対するモデルフリー境界の計算を考察する。
この設定における資産価格の基本的な定理と、確率測度よりも問題を変換できる双対性を提供する。
後者は、ニューラルネットワークを用いたディープラーニング近似と組み合わせたペナライズ手法を用いて解決される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:37:22 GMT)
How much symmetry do symmetric measurements need for efficient operational applications? [0.0] 情報的完備集合に対しては、正則エルミート作用素基底を用いた構成法を提案する。
一般化の過程で失われる対称性の性質のいくつかは、すべてのPOVMに対して同じ数の要素を固定することなく回復することができる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:23:08 GMT)
Horoballs and the subgradient method [0.0] 我々は、アダマール空間上の凸最適化を、下次アルゴリズムのスタイルで検討する。
我々の反復は一般のアダマール空間に適用され、基礎空間自体にフレーム化され、対象のレベル集合の球面凸性に依存する。
本稿では,アダマール空間における極小囲み球問題に対する段階的アルゴリズムについて述べる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:11:09 GMT)
Granular Aluminum Parametric Amplifier for Low-Noise Measurements in Tesla Fields [0.0] 2つの結合したGraAl共振器で作られた非縮退増幅器を1Tまでの面内磁場に抵抗する。
加算雑音の量子限界に近い20dBのゲインを提供し、ゲイン帯域幅は28MHz、入力飽和電力は-110dBmである。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:12:54 GMT)
Geometric quantum discord of an arbitrary two-qudit state: the exact value and general upper bounds [0.0] 一般の2量子状態に対する幾何量子不協和の明確な正確な解析値を求める。
これにより、任意の2量子状態、純粋あるいは混合、幾何学的量子不協和の新たな一般上界を見つけることができる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 08:34:19 GMT)
GUARD-D-LLM: An LLM-Based Risk Assessment Engine for the Downstream uses of LLMs [0.0] 本稿では,大規模言語モデル(LLM)の下流から発生するリスクについて検討する。
テキストベースのユーザ入力から派生した特定のユースケースに関連する脅威を特定し、ランク付けする新しいLCMベースのリスクアセスメントエンジン(GUARD-D-LLM)を導入する。
30の知的エージェントを統合することで、この革新的なアプローチは、悪夢のリスクを特定し、その重症度を測定し、緩和のためのターゲットとなる提案を提供し、リスク認識開発を促進する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 05:25:17 GMT)
Full Counting Statistics of Charge in Quenched Quantum Gases [0.0] ボースとフェルミの気体を相互作用する1次元の粒子数の完全な数え上げ統計について検討する。
初期状態と長時間の電荷のスケールした累積が単に関連していることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:11:10 GMT)
From Seaweed to Security: The Emergence of Alginate in Compromising IoT Fingerprint Sensors [0.0] 茶色の海藻由来のバイオポリマーであるAlginateを,IoT固有の容量型指紋センサをスポーフィングする新しい材料として紹介する。
当社の研究では、Alginateと最先端の画像認識技術を使用して、セキュリティとプライバシに関する重大な懸念を提起するニュアンスなIoT脆弱性を明らかにしています。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 17:58:24 GMT)
Few-shot point cloud reconstruction and denoising via learned Guassian splats renderings and fine-tuned diffusion features [0.0] 本稿では,少数の画像から点雲を再構成し,そのレンダリングから点雲を識別する手法を提案する。
制約条件下での再構成を改善するため,ハイブリッド表面と外観の相違点のトレーニングを規則化する。
これらの学習したフィルタを使って、3Dの監督なしに来る点雲ノイズを除去する方法を実証する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:21:38 GMT)
Exploring How Multiple Levels of GPT-Generated Programming Hints Support or Disappoint Novices [0.0] 本研究は,学生の問題解決と学習を支援するヒントのレベルの違いについて検討した。
LLMヒントファクトリーを用いた12初心者を対象にシンクアップアラウド調査を行った。
ハイレベルな自然言語のヒントだけでは役に立たないか、あるいは誤解を招く可能性があることがわかりました。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 18:05:26 GMT)
Explicit formulas for adiabatic elimination with fast unitary dynamics [0.0] オープン量子系における高速減衰自由度のいわゆる「断熱除去」は、時間スケール分離における一連の展開によって行うことができる。
関連する計算は、残り自由度が単に遅くなるのではなく、高速なユニタリダイナミクスに従う場合、はるかに困難である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:03:33 GMT)
Evaluating Large Language Models Using Contrast Sets: An Experimental Approach [0.0] 本研究では,スタンフォード自然言語推論データセットのコントラストセットを生成する革新的な手法を提案する。
我々の戦略は、動詞、副詞、形容詞をその同義語と自動置換して、文の本来の意味を保存することである。
本手法は,モデルの性能が真の言語理解に基づくのか,それとも単にパターン認識に基づくのかを評価することを目的とする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 02:03:28 GMT)
Enhancing wind field resolution in complex terrain through a knowledge-driven machine learning approach [0.0] ニューラルネットワークを用いたモデルでは、局所的な地形を尊重しながら、粗いスケールから完全に解決された3次元速度場を再構築できることが示される。
また、ドメイン知識に基づく適切なコスト関数を用いることで、敵のトレーニングの使用を軽減できることを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:24:24 GMT)
Enhancing Inference Efficiency of Large Language Models: Investigating Optimization Strategies and Architectural Innovations [0.0] この論文はモデル圧縮の手法を探求する。
モデル圧縮の有効な方法として,トランスフォーマーLLMにおいて,後続の注意サブレイヤをスキップする簡単な手法を実証的に示す。
その結果,Llama 2 7Bでは21%の高速化が見られた。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:53:54 GMT)
Enhancing Formal Theorem Proving: A Comprehensive Dataset for Training AI Models on Coq Code [0.0] Coqの証明アシスタントは、数学的アサーションとソフトウェアの正確性を検証するための厳格なアプローチで際立っている。
人工知能と機械学習の進歩にもかかわらず、Coq構文と意味論の特殊性は大規模言語モデル(LLM)に固有の課題をもたらす。
このデータセットは、10,000以上のCoqソースファイルのコレクションから派生したもので、幅広い命題、証明、定義を含んでいる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:54:47 GMT)
EnergAIze: Multi Agent Deep Deterministic Policy Gradient for Vehicle to Grid Energy Management [0.0] 本稿では,MARL(Multi-Agent Reinforcement Learning)エネルギー管理フレームワークであるEnergAIzeを紹介する。
ユーザ中心の多目的エネルギー管理を可能にし、各プローサが様々な個人管理目標から選択できるようにする。
EnergAIzeの有効性は、CityLearnシミュレーションフレームワークを用いたケーススタディにより評価された。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 23:16:17 GMT)
End-to-End Demonstration for CubeSatellite Quantum Key Distribution [0.0] 小型ナノサテライトを用いた衛星ベースの量子鍵交換の実現可能性について検討する。
本稿では,キューブ衛星シナリオを対象としたシステムレベルの量子鍵分布の最初のプロトタイプを示す。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:43:26 GMT)
EV2Gym: A Flexible V2G Simulator for EV Smart Charging Research and Benchmarking [0.0] 本稿では,小型かつ大規模なスマート充電アルゴリズムの開発と評価を目的とした,現実的なシミュレータプラットフォームEV2Gymを紹介する。
提案するシミュレータには, 実データを用いた総合的なEV, 充電ステーション, 電力変換器, EV挙動モデルが格納されている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 11:22:53 GMT)
Dynamics of a quantum system interacting with white non-Gaussian baths: Poisson noise master equation [0.0] 浴槽のポアソンノイズ特性に影響を受ける量子散逸系を記述する理論を考案する。
得られたマスター方程式は、ホワイトノイズ状態における非ガウス浴効果を明らかにする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:49:40 GMT)
Duality transformations and the entanglement entropy of gauge theories [0.0] スピンモデルの観点から二重記述を持つ格子ゲージ理論について検討する。
第一部では、ゲージ理論のレプリカ空間の構造を導出し、レプリカ幾何学における双対変換を行う。
第2部では、3次元の時空次元におけるZ$ゲージ理論のエントロピーc-函数であるモンテカルロシミュレーションを用いて計算する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:24:51 GMT)
Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification [0.0] 本研究では,乳がんの新たな分類法であるDual-Activated Lightweight Attention ResNet50モデルを提案する。
トレーニング済みのResNet50モデルと軽量なアテンション機構を統合し、ResNet50の第4層にアテンションモジュールを埋め込む。
DALAResNet50法は,40X,100X,200X,400Xの乳がん組織像を用いて,それぞれ98.5%,98.7%,97.9%,94.3%の検診を行った。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:14:26 GMT)
Diagonal Coset Approach to Topological Quantum Computation with Fibonacci Anyons [0.0] 本研究では、フィボナッチ・アロンに基づくトポロジカル量子計算のための有望な共形場理論の実現スキームについて検討する。
量子ゲートはこれらをブレイディングすることで実現される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 09:44:02 GMT)
Device Independent Quantum Key Distribution with realistic single-photon source implementations [0.0] Device Independent Quantum Key Distribution (DIKQD) は、デバイスを信頼せずに、遠隔者間で秘密鍵を生成することを目的としている。
本研究では, 単光子源に基づくフルフォトニックDIQKDの提案と, 両者の間に位置する中央駅におけるシーディング測定について検討する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:25:46 GMT)
Detection of direct path component absence in NLOS UWB channel [0.0] NLOS(Non-Line-of-Sight)識別技術を提案する。
遅延したダイレクトパスコンポーネントが完全にブロックされ、導入されたバイアスがずっと高くなり、緩和するのが難しくなる状況を認識します。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 23:20:57 GMT)
Consistent treatment of quantum systems with a time-dependent Hilbert space [0.0] 一般に、ハミルトニアン作用素は、それが自己随伴作用素であるとしても、システムの可観測性を表すものではない。
これは、演算子値のゲージポテンシャルの存在から生じる量子力学の隠れ幾何学的な側面に関連している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 12:13:56 GMT)
Comparative Study of Domain Driven Terms Extraction Using Large Language Models [0.0] キーワードは、人間の理解とテキストデータの機械処理のギャップを埋める上で重要な役割を果たす。
本稿では,Llama2-7B,GPT-3.5,Falcon-7Bの3つの主要言語モデル (LLM) の利用を強調したキーワード抽出手法について述べる。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 22:04:51 GMT)
Collapse of Self-trained Language Models [0.0] 私たちは、人間が以前の思考や行動に基づいて学習し、構築する方法に似た、自己学習モデルの自分たちのアウトプットでの可能性を探る。
GPT-2モデルの拡張自己学習により,性能が著しく低下し,繰り返しおよび崩壊したトークンが出力されることがわかった。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 21:03:37 GMT)
Classifying Graphemes in English Words Through the Application of a Fuzzy Inference System [0.0] 言語学において、グラテム(グラテム、英: grapheme)とは、音韻音に対応する書記体系の書記単位である。
本稿では,単語をグラフに分割するファジィ推論システムを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 13:47:52 GMT)
Classical analogue of quantum superdense coding and communication advantage of a single quantum system [0.0] 古典的共有ランダム性の助けのないキュービット通信は,その目的を達成することができることを示す。
また、対称多角形状態空間によって記述された古典的でない玩具類の通信ユーティリティについても検討する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:40:03 GMT)
Causality-based Transfer of Driving Scenarios to Unseen Intersections [0.0] シナリオベースのテストでは、自動関数は事前に定義されたシナリオのセットで評価される。
現実的なシナリオを作成するには、パラメータとパラメータの依存関係を実際のデータを活用する必要がある。
本稿では,シナリオのパラメータ間の関係を体系的に解析する手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 15:38:18 GMT)
CARLOS: An Open, Modular, and Scalable Simulation Framework for the Development and Testing of Software for C-ITS [0.0] CARLOS - C-ITSにおけるソフトウェアの開発とテストのためのオープンでモジュール化されたスケーラブルなシミュレーションフレームワークを提案する。
このフレームワークの中核となるビルディングブロックを提供し、コミュニティによってどのように利用され、拡張されるかを説明します。
本稿では、重要な設計原則を説明し、3つの主要なユースケースを示すことによって、アーキテクチャのモチベーションを高める。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 10:48:36 GMT)
Automated User Story Generation with Test Case Specification Using Large Language Model [0.0] 要件文書からユーザストーリーを自動生成するツール「GeneUS」を開発した。
アウトプットはフォーマットで提供され、ダウンストリーム統合の可能性は人気のあるプロジェクト管理ツールに開放されます。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 01:45:57 GMT)
Audio Simulation for Sound Source Localization in Virtual Evironment [0.0] 信号遮断環境における非視線局所化は、難しいが関連する問題である。
本研究では,物理基底音の伝搬シミュレーションと機械学習手法を利用して,仮想環境内の特定の場所に音源を配置することを目的とする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:18:28 GMT)
Accurate and precise quantum computation of valence two-neutron systems [0.0] 2つの中性子系の基底状態を精度良く正確に計算する量子アルゴリズムを導入する。
実量子デバイスを用いた実験では、量子ビットの接続性に配慮した回路レイアウト設計の重要な役割も示している。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:54:13 GMT)
Accelerated quantum circuit Monte-Carlo simulation for heavy quark thermalization [0.0] 我々は、重クォーク熱化をシミュレートするために、加速量子回路モンテカルロフレームワークを導入し、形式化する。
アインシュタインの関係で連結された簡易なドラッグと拡散係数により、重クォークの等方性および異方性媒体における熱化をシミュレートする。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:59:11 GMT)
Ab initio extended Hubbard model of short polyenes for efficient quantum computing [0.0] 本稿では,ab initioダウンフォールディング法により導出される拡張ハバード・ハミルトンを導入することを提案する。
ab initio拡張ハバード・ハミルトンは量子コンピュータを用いた量子化学計算において大きな可能性を秘めている可能性がある。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 04:13:09 GMT)
AI Act and Large Language Models (LLMs): When critical issues and privacy impact require human and ethical oversight [0.0] 人間の監視、倫理的監視、プライバシーへの影響評価に対処する。
この貢献は、人間の監視、倫理的監視、およびプライバシーへの影響評価に対処する。
プライバシー、個人データ保護、倫理レベルで、特に最も弱く最も脆弱な領域において、リスクのレベルとそれらが与える影響を評価する必要があると結論付けている。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 06:05:29 GMT)
A new lightweight additive homomorphic encryption algorithm [0.0] 本稿では、同じ暗号鍵と復号鍵を持つ軽量な加法的同型アルゴリズムについて述べる。
これにより、モジュラー指数からモジュラー乗算への暗号化と復号化の計算コストが削減される。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 03:36:37 GMT)
A discussion about violin reduction: geometric analysis of contour lines and channel of minima [0.0] 縮小された楽器と非還元された楽器の差を観察し、特に輪郭線とミニマの流路で観察する。
最近の予備研究で、光グラム法により得られた三角形の3Dメッシュを用いて、2つの楽器の2つの特徴を計算し、強調した。
ここでは、38のヴァイオリン、ヴァイオラ、チェロのコーパスを拡張し、改良された手順を導入することを提案する。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 14:40:11 GMT)
A Quadratic Sample Complexity Reduction for Agnostic Learning via Quantum Algorithms [0.0] 我々は,$O(mboxlog(frac1delta)/epsilon)を$epsilon,deltarightarrow 0arrowとして新しいサンプル複雑性上限を求める。
一般学習の場合、学習速度の量子スピードアップは、$epsilon-1$の2乗である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 20:15:41 GMT)
A Post Quantum Key Agreement Protocol Based on a Modified Matrix Power Function over a Rectangular Matrices Semiring [0.0] Sakalauskas行列パワー関数は共有秘密鍵を生成するための効率的で安全な方法である。
そこで我々は,Sakalauskas行列パワー関数鍵契約プロトコルの量子後バージョンを改良した。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 16:45:28 GMT)
A Novel Approach to Reduce Derivative Costs in Variational Quantum Algorithms [0.0] QNDM(Quantum Non-Demolition Measurement)は、量子可観測体の勾配やヘッセンを効率的に推定する。
これは、量子オブザーバブルに関連するコスト関数を最小限にしたい場合、重要なステップであり、リソース要求タスクです。
コスト関数の導関数を評価する際に、QNDMアプローチはより効率的である。
論文参考訳(メタデータ) (Tue, 2 Apr 2024 19:06:01 GMT)