Not All Metrics Are Guilty: Improving NLG Evaluation by Diversifying References [123.4] Div-Refは、参照数を増やして評価ベンチマークを強化する方法である。
本研究では,参照表現の多様化が自動評価と人的評価の相関性を大幅に向上させることを示す実験を行った。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:52:28 GMT)
An Incomplete Loop: Deductive, Inductive, and Abductive Learning in Large Language Models [99.3] 現代の言語モデル(LM)は、異なる方法で新しいタスクを実行することを学べる。
次の命令では、ターゲットタスクは自然言語で明示的に記述され、少数ショットプロンプトでは、タスクは暗黙的に指定される。
命令推論では、LMはインコンテキストの例を示し、自然言語のタスク記述を生成するように促される。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:31:56 GMT)
Neuromorphic Split Computing with Wake-Up Radios: Architecture and Design via Digital Twinning [98.0] 本研究は,遠隔・無線接続型NPUからなる分割計算機システムに,覚醒無線機構を組み込んだ新しいアーキテクチャを提案する。
覚醒無線に基づくニューロモルフィックスプリットコンピューティングシステムの設計における重要な課題は、検知、覚醒信号検出、意思決定のためのしきい値の選択である。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:23:06 GMT)
On the Scalability of Diffusion-based Text-to-Image Generation [97.6] 拡散に基づくテキスト・ツー・イメージ(T2I)モデルのスケーリング特性について検討する。
モデルスケーリングでは、既存のUNet設計の性能を区別して、クロスアテンションの位置と量を求める。
データスケーリングの面では、単にデータセットのサイズではなく、トレーニングセットの品質と多様性が重要です。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:34:28 GMT)
What Are We Measuring When We Evaluate Large Vision-Language Models? An Analysis of Latent Factors and Biases [87.7] データから潜在視覚言語スキルの発見を目的とした大規模な移動学習実験を行った。
生成タスクが長さバイアスに悩まされることを示し、ベンチマークは出力長の異なるタスクのバランスをとるべきであることを示唆する。
我々は新しいデータセットOLIVEを提示し、そこでユーザーの指示をシミュレーションし、テストしたすべてのデータセットと異なる課題を提示します。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:40:35 GMT)
ChatGLM-RLHF: Practices of Aligning Large Language Models with Human Feedback [86.9] ChatGLMは、大規模言語モデル(LLM)を利用した、無償のAIサービスである。
本稿では,ChatGLM-RLHFパイプラインについて述べる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:04:06 GMT)
Towards Codable Watermarking for Injecting Multi-bits Information to LLMs [86.9] 大規模言語モデル(LLM)は、流布とリアリズムを増大させるテキストを生成する。
既存の透かし方式はエンコーディング非効率であり、多様な情報エンコーディングニーズに柔軟に対応できない。
テキスト透かしを複数ビットでカスタマイズ可能な情報を運ぶことができるCTWL (Codable Text Watermarking for LLMs) を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:36:40 GMT)
Text-Driven Image Editing via Learnable Regions [74.5] 本研究では,ユーザが提供するマスクやスケッチを必要とせずに,テキストプロンプトによって駆動される領域ベースの画像編集手法を提案する。
この単純なアプローチにより、現在の画像生成モデルと互換性のあるフレキシブルな編集が可能になることを示す。
実験では,提案した言語記述に対応する忠実度とリアリズムの高い画像の操作において,提案手法の競合性能を示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:05:28 GMT)
Three Heads Are Better Than One: Complementary Experts for Long-Tailed Semi-supervised Learning [74.4] 本稿では,様々なクラス分布をモデル化するComPlementary Experts (CPE) を提案する。
CPEは、CIFAR-10-LT、CIFAR-100-LT、STL-10-LTのベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:38:12 GMT)
MCUNetV2: Memory-Efficient Patch-based Inference for Tiny Deep Learning [72.8] メモリボトルネックは畳み込みニューラルネットワーク(CNN)の設計における不均衡なメモリ分布に起因する。
本稿では,ピークメモリを大幅に削減するパッチ・バイ・パッチ・推論スケジューリングを提案する。
ニューラルアーキテクチャサーチによるプロセスを自動化し、ニューラルアーキテクチャと推論スケジューリングを共同で最適化し、MCUNetV2に導いた。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:12:53 GMT)
Effective Adapter for Face Recognition in the Wild [72.8] 私たちは、画像が低品質で現実世界の歪みに悩まされる、野生の顔認識の課題に取り組みます。
従来のアプローチでは、劣化した画像や、顔の復元技術を使って強化された画像を直接訓練するが、効果がないことが証明された。
高品質な顔データセットで訓練された既存の顔認識モデルを強化するための効果的なアダプタを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:11:54 GMT)
Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition [72.4] 視覚的位置認識のための事前学習モデル(VPR)のシームレスな適応を実現する新しい手法を提案する。
具体的には、地域を識別するための有意義なランドマークに焦点を当てたグローバルな特徴とローカルな特徴の両方を得るために、ハイブリッド適応法を設計する。
実験結果から,本手法はトレーニングデータやトレーニング時間が少なく,最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:59:08 GMT)
MambaByte: Token-free Selective State Space Model [71.9] マンババイト(英: MambaByte)は、マンバSSMがバイト配列で自己回帰的に訓練したトークンレス適応である。
MambaByteは、言語モデリングタスクにおいて、最先端のサブワードトランスフォーマーよりも優れています。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:36:27 GMT)
Learning a Fourier Transform for Linear Relative Positional Encodings in Transformers [71.3] 我々はLearner-Transformer (Learners)と呼ばれる線形変換器の新しいクラスを提案する。
様々な相対的位置エンコーディング機構(RPE)を組み込んでいる。
これらには、シーケンシャルデータに適用される正規の RPE 技術や、高次元ユークリッド空間に埋め込まれた幾何学的データを操作する新しい RPE などが含まれる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:24:50 GMT)
Analysis of Video Quality Datasets via Design of Minimalistic Video Quality Models [71.1] BVQA(Blind Quality Assessment)は、実世界のビデオ対応メディアアプリケーションにおけるエンドユーザの視聴体験の監視と改善に不可欠である。
実験分野として、BVQAモデルの改良は、主に数個の人間の評価されたVQAデータセットに基づいて測定されている。
最小主義的BVQAモデルを用いて,VQAデータセットの第一種計算解析を行う。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:04:55 GMT)
Language Guided Domain Generalized Medical Image Segmentation [68.9] 単一ソースドメインの一般化は、より信頼性が高く一貫性のあるイメージセグメンテーションを現実の臨床環境にわたって約束する。
本稿では,テキストエンコーダ機能によって案内されるコントラスト学習機構を組み込むことで,テキスト情報を明確に活用する手法を提案する。
文献における既存手法に対して,本手法は良好な性能を発揮する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:27:01 GMT)
Mirasol3B: A Multimodal Autoregressive model for time-aligned and contextual modalities [67.9] マルチモーダル学習の主な課題の1つは、異質なモダリティを組み合わせる必要があることである。
ビデオとオーディオはテキストよりもはるかに高いレートで取得され、ほぼ時間内に整列される。
我々の手法は、確立されたマルチモーダルベンチマークの最先端性を達成し、はるかに大きなモデルより優れている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:04:49 GMT)
Personality-affected Emotion Generation in Dialog Systems [67.4] ダイアログシステムに与えられた個性に基づいて感情を生成する新しいタスクであるパーソナリティ影響感情生成を提案する。
本課題の課題,すなわち,(1)個性と感情的要因を不均一に統合し,(2)対話場面における多粒性感情情報を抽出する。
その結果,感情生成性能はマクロF1では13%,重み付きF1では5%向上することが示唆された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:48:50 GMT)
Backdooring Instruction-Tuned Large Language Models with Virtual Prompt Injection [66.9] 命令調整型LLMに適した新しいバックドアアタック設定を提案する。
VPI攻撃では、攻撃者が特定した仮想プロンプトがユーザ命令に形式化されたかのように、バックドアモデルが応答することが期待されている。
我々は、モデルの命令チューニングデータに毒を盛ることによって脅威を実証する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:53:20 GMT)
Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3] 本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:09:58 GMT)
Nested Event Extraction upon Pivot Element Recogniton [66.2] ネストイベントは、インナーネストイベントの引き金として、同時に外部ネストイベントの引数として機能するPivot Elements(PE)の一種を含む。
本稿では,PEの認識に基づくネストイベントを抽出するPerNeeという新しいモデルを提案する。
このモデルは、プロンプトラーニングを使用して、イベントタイプと引数ロールの両方からの情報を組み込んで、より優れたトリガーと引数表現を提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:14:28 GMT)
Emulated Disalignment: Safety Alignment for Large Language Models May Backfire! [65.1] 大規模言語モデル(LLM)は、人間との安全な会話を確保するために安全アライメントを行う必要がある。
本稿では,安全アライメントを逆転し,有害な言語モデルを生成することを実証する推論時アタック手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:25:47 GMT)
UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions [64.5] 我々は,様々な音声言語理解(SLU)タスクを共同で行う単一モデルを構築した。
我々は17のデータセットと9の言語にまたがる12の音声分類とシーケンス生成タスクタイプに対して,1つのマルチタスク学習モデル"UniverSLU"の有効性を実証した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:12:36 GMT)
SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting [63.0] 私たちは完全に自動化されたパイプラインを開発し、約0.6百万のニュース記事からMidEast-TEという大規模なデータセットを構築しました。
このデータセットは、2015年から2022年まで、主に中東地域での協力と紛争イベントに焦点を当てている。
そこで本稿では,SCTc-TE予測にローカルコンテキストとグローバルコンテキストの両方を活用可能なLoGoを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:15:16 GMT)
On-Device Training Under 256KB Memory [63.0] 本稿では,256KBのメモリでデバイス上でのトレーニングを可能にするアルゴリズム・システム協調設計フレームワークを提案する。
私たちのフレームワークは256KBと1MBのFlashで畳み込みニューラルネットワークのデバイス上での小さなトレーニングを可能にする最初のソリューションです。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:15:55 GMT)
Guarantees of confidentiality via Hammersley-Chapman-Robbins bounds [61.5] ノイズは最終分類器や他のタスク固有のレイヤの前に、最後のレイヤのアクティベーションに追加される。
入力の可能な全ての非バイアス推定器のばらつきを低くすることは、そのような付加ノイズから生じる機密性を定量化する。
数値実験により、HCR境界は小さなニューラルネットに対して有効である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:58:03 GMT)
MaLA-500: Massive Language Adaptation of Large Language Models [61.4] MALA-500は、幅広い534言語をカバーするように設計された、新しい大きな言語モデルである。
我々の本質的な評価は,MALA-500 が既存の多言語 LLM よりも低リソース言語のテキストの予測に優れていることを示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:23:06 GMT)
ALOHa: A New Measure for Hallucination in Captioning Models [61.0] 既存の物体幻覚の計量であるCHAIRは、MS COCOオブジェクトとシノニムの固定セットに限られる。
そこで我々は,大規模言語モデル(LLM)を利用して物体の幻覚を測定する,最新のオープン語彙メトリックALOHaを提案する。
ALOHaはHAT上のCHAIRよりも13.6%多くの幻覚物質を正しく同定することを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:59:36 GMT)
Long-form factuality in large language models [60.1] 大規模言語モデル(LLM)は、しばしば、オープンエンドトピックの事実検索プロンプトに応答するときに、事実エラーを含むコンテンツを生成する。
我々は、GPT-4を用いて、オープンドメインにおけるモデルの長文事実をベンチマークし、LongFactを生成する。
そこで我々は,LLMエージェントを検索拡張現実性評価器 (SAFE) と呼ぶ手法により,長期的事実性の自動評価器として使用できることを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:54:11 GMT)
CMULAB: An Open-Source Framework for Training and Deployment of Natural Language Processing Models [59.9] 本稿では,NLPモデルのモデル展開と連続的なヒューマン・イン・ザ・ループの微調整を簡単にするオープンソースフレームワークであるCMU言語バックエンドを紹介する。
CMULABは、マルチ言語モデルのパワーを活用して、音声認識、OCR、翻訳、構文解析などの既存のツールを新しい言語に迅速に適応し、拡張することができる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:21:46 GMT)
RS-Mamba for Large Remote Sensing Image Dense Prediction [58.1] VHRリモートセンシングにおける高密度予測タスクのためのリモートセンシングマンバ(RSM)を提案する。
RSMは、線形複雑なリモートセンシング画像のグローバルな特徴をモデル化し、大きなVHR画像を効率的に処理できるように設計されている。
RSMは、VHRリモートセンシングの高密度予測タスクにおいて最先端の性能を達成する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:06:01 GMT)
PhonologyBench: Evaluating Phonological Skills of Large Language Models [57.8] 音声学は、音声の構造と発音規則の研究であり、Large Language Model (LLM) 研究において批判的であるが、しばしば見落とされがちな要素である。
LLMの音韻的スキルを明示的にテストするための3つの診断タスクからなる新しいベンチマークであるPhonologyBenchを提案する。
我々は,Rhyme Word GenerationとSyllable countingにおいて,人間と比較した場合,それぞれ17%と45%の有意なギャップを観察した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:53:14 GMT)
Revisiting subword tokenization: A case study on affixal negation in large language models [57.8] 現代英語大言語モデル(LLM)に対する接尾辞否定の影響を計測する。
我々は、異なるサブワードトークン化手法を用いてLLMを用いて実験を行う。
モデルは全体として、接尾辞の意味を確実に認識できることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:14:27 GMT)
Instructional Fingerprinting of Large Language Models [57.7] 本稿では,非常に軽量なインストラクションチューニングの一形態として,Large Language Model (LLM) の指紋認証に関する実験的検討を行う。
11個の LLM 実験の結果,このアプローチは軽量であり,モデルの正常な挙動には影響しないことがわかった。
また、パブリッシャーの誇張を防ぎ、指紋の推測やパラメータ効率のトレーニングに対する堅牢性を維持し、MITライセンスのような多段階の指紋認証をサポートする。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:23:34 GMT)
"One-Size-Fits-All"? Examining Expectations around What Constitute "Fair" or "Good" NLG System Behaviors [57.6] NLGシステム入力において、異なる種類のアイデンティティ関連言語特徴(名前、役割、場所、方言、スタイル)を摂動するケーススタディを行う。
適応の動機には、社会的規範、文化的相違、特徴特化情報、宿泊が含まれる。
対照的に、不変性のモチベーションには、規範主義を支持する視点、NLGシステムが適切に行うのが不必要または困難であると見なす視点、偽の仮定に注意を払っている視点が含まれる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:20:15 GMT)
AWOL: Analysis WithOut synthesis using Language [57.3] 言語を利用して既存の3次元形状モデルを制御し、新しい形状を作り出す。
トレーニング中に存在しない新しい動物をテキストで生成できることが示されています。
この研究は、3D木を生成するための最初の言語駆動の手法でもある。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:04:44 GMT)
Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild [57.1] SUPIR (Scaling-UP Image Restoration) は、生成前処理とモデルスケールアップのパワーを利用する、画期的な画像復元手法である。
モデルトレーニングのための2000万の高解像度高画質画像からなるデータセットを収集し、それぞれに記述的テキストアノテーションを付加する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:12:08 GMT)
Instruction-Driven Game Engines on Large Language Models [56.2] IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:47:00 GMT)
Characterization of Large Language Model Development in the Datacenter [56.0] 大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。
しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。
我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:07:33 GMT)
Toward Inference-optimal Mixture-of-Expert Large Language Models [56.0] 大規模言語モデル(LLM)のスケーリング法則について検討する。
少数の(4/8)専門家を持つMoEsは、同じパフォーマンスで最も効率的なソリューションであるが、トレーニングでは2.5-3.5倍のコストがかかる。
検証損失以外の指標として推論効率を導入することで,MoEのスケーリング法則の改正を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:33:42 GMT)
Learning Object State Changes in Videos: An Open-World Perspective [55.8] 本稿では,オブジェクト状態変化問題に対する新しいオープンワールドの定式化について紹介する。
目標は、OSCの3つのステージ -- オブジェクトの初期状態、遷移状態、そして最終状態 -- を時間的にローカライズすることだ。
We present HowToChange, a first open-world benchmark for video OSC localization。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:57:35 GMT)
HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression [55.6] 3D Gaussian Splatting (3DGS) は、新しいビュー合成のための有望なフレームワークとして登場した。
高速な3DGS表現のためのHash-grid Assisted Context (HAC) フレームワークを提案する。
私たちの研究は、コンテキストベースの3DGS表現の圧縮を探求するパイオニアです。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:46:54 GMT)
ARS-DETR: Aspect Ratio Sensitive Oriented Object Detection with Transformer [55.3] 既存のオブジェクト指向オブジェクト検出手法では、モデルの性能を測定するために計量AP$_50$が一般的である。
我々は、AP$_50$は本来、角度偏差に大きな耐性があるため、オブジェクト指向物体検出には適さないと主張している。
本稿では,ARS-DETR(Aspect Ratio Sensitive Oriented Object Detector with Transformer)を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:51:21 GMT)
KnowHalu: Hallucination Detection via Multi-Form Knowledge Based Factual Checking [55.2] KnowHaluは、大規模言語モデル(LLM)によって生成されたテキスト中の幻覚を検出する新しいアプローチである
ステップワイズ推論、マルチフォームクエリ、ファクトチェックのためのマルチフォーム知識、フュージョンベースの検出メカニズムを使用する。
評価の結果,KnowHaluは様々なタスクにおける幻覚検出においてSOTAベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:52:07 GMT)
MULAN: A Multi Layer Annotated Dataset for Controllable Text-to-Image Generation [54.6] 44K MUlti-Layer-wise RGBA 分解からなる新しいデータセット MuLAn を紹介する。
MuLAnは、高品質な画像のインスタンス分解と空間情報を提供する最初のフォトリアリスティックなリソースである。
我々は,新しい生成・編集技術,特にレイヤワイドソリューションの開発を促進することを目的としている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:58:00 GMT)
UNO-DST: Leveraging Unlabelled Data in Zero-Shot Dialogue State Tracking [54.5] 従来のゼロショット対話状態追跡(DST)手法は、対象領域における非競合データを無視して、転送学習のみを適用した。
我々は,ゼロショットDSTを,ジョイントおよび自己学習手法による非ラベルデータを利用して,少数ショットDSTに変換する。
ゼロショットシナリオにおける汎用言語モデルに対する本手法の有効性を実証し、MultiWOZの全ドメインで平均的な共同ゴール精度を8%向上する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:05:56 GMT)
Instructions as Backdoors: Backdoor Vulnerabilities of Instruction Tuning for Large Language Models [53.4] 本稿では,タスク命令付きクラウドソースデータセット上でモデルが訓練され,優れたパフォーマンスを実現するという,創発的命令チューニングパラダイムのセキュリティ上の懸念について検討する。
本研究は、悪意のある指示をほとんど出さず、データ中毒によるモデル行動を制御することによって、攻撃者がバックドアを注入できることを実証する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:15:15 GMT)
Tradeoffs of Diagonal Fisher Information Matrix Estimators [53.4] 計算コストが高いことから、実践者はしばしばランダムな推定器を使用し、対角成分のみを評価する。
精度とサンプルの複雑さが関連する分散に依存する2つの推定器について検討する。
分散の境界を導出し、回帰と分類のネットワークでそれらをインスタンス化する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 00:16:25 GMT)
NEAT: Distilling 3D Wireframes from Neural Attraction Fields [52.9] 本稿では,3次元再構成セグメントと焦点接合を用いたラインフレーム接合の問題について検討する。
ProjectNEATは、クロスアートマッチングをゼロから行わずに、ジョイントニューラルフィールドとビューを楽しみます。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:45:52 GMT)
Calibrating the Confidence of Large Language Models by Eliciting Fidelity [52.5] RLHFのようなテクニックで最適化された大規模な言語モデルは、有用で無害な点において優れた整合性を実現している。
調整後、これらの言語モデルはしばしば過剰な自信を示し、表現された自信は正確さの度合いで正確に校正しない。
本稿では,言語モデルの信頼度を推定するプラグイン・アンド・プレイ手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:36:12 GMT)
MuLan: A Study of Fact Mutability in Language Models [50.6] 信頼できる言語モデルは、理想的には変更可能な事実をそのようなものとして識別し、それに従って処理する。
MuLanは、英語モデルが時間一貫性を予測できる能力を評価するためのベンチマークです。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:47:33 GMT)
From Isolated Islands to Pangea: Unifying Semantic Space for Human Action Understanding [50.4] アクション理解は、物理空間から意味空間へのマッピングとして形成することができる。
そこで本研究では,Pangeaを完全に活用するために,物理空間から意味空間への新たなモデルマッピングを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:36:31 GMT)
Blessing or curse? A survey on the Impact of Generative AI on Fake News [45.0] 現在、高品質で個別にターゲットとするフェイクニュースのマス作成を自動化することが可能である。
この調査は、2024年のフェイクニュースの検出と作成のためのジェネレーティブAIの研究と実用化に関する総合的な調査を提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:14:45 GMT)
The RealHumanEval: Evaluating Large Language Models' Abilities to Support Programmers [44.3] 大規模言語モデル(LLM)を用いたコーディングにおいて,既存のベンチマークのゲインがプログラマの生産性向上に寄与するかどうかを検討する。
本稿では,プログラマを支援するためのLLMの能力を測定するためのWebインターフェースであるRealHumanEvalについて,オートコンプリートあるいはチャットサポートを通じて紹介する。
プログラマの好みは実際のパフォーマンスと相関せず、より優れた人間中心のプロキシ信号の必要性を動機付けている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:20:57 GMT)
Exploring Cross-Cultural Differences in English Hate Speech Annotations: From Dataset Construction to Analysis [44.2] ほとんどのヘイトスピーチデータセットは、単一の言語における文化的多様性を無視している。
そこで本研究では,CRoss文化の英語Hate音声データセットであるCREHateを紹介する。
CREHateのポストの56.2%のみが全国でコンセンサスを達成しており、ペアのラベル差が最も高いのは26%である。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:57:49 GMT)
Cross-Attention Makes Inference Cumbersome in Text-to-Image Diffusion Models [43.4] 本研究では,テキスト条件拡散モデルにおける推論におけるクロスアテンションの役割について検討する。
クロスアテンション出力は、わずかな推論ステップの後に一定点に収束する。
驚くべきことに、忠実度改善段階のテキスト条件を無視することは複雑さを減少させるだけでなく、モデル性能も維持する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:44:41 GMT)
AAA: an Adaptive Mechanism for Locally Differential Private Mean Estimation [43.0] ローカルディファレンシャルプライバシ(LDP)は、一般的なソフトウェアシステムで採用されている強力なプライバシ標準である。
本稿では, 平均効用に対処する分布認識手法である, 適応型アダプティブ (AAA) 機構を提案する。
我々は、厳密なプライバシー証明、ユーティリティ分析、そしてAAAと最先端のメカニズムを比較した広範な実験を提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:31:26 GMT)
ChatGLM-Math: Improving Math Problem-Solving in Large Language Models with a Self-Critique Pipeline [42.6] 大規模言語モデル(LLM)は、人間の言語の優れた習得を示すが、数学的な問題解決を必要とする現実世界のアプリケーションでは依然として苦戦している。
LLMアライメントのフィードバック学習段階における課題に対処する自己批判パイプラインを調整します。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:51:18 GMT)
Investigation of Energy-efficient AI Model Architectures and Compression Techniques for "Green" Fetal Brain Segmentation [42.5] 医療画像における胎児脳のセグメンテーションは、胎児の脳の大きさが小さく、高速な2次元配列の画質が制限されているため困難である。
ディープニューラルネットワークはこの課題を克服するための有望な方法だ。
本研究の目的は,エネルギー効率を高めるモデルアーキテクチャと圧縮技術を検討することである。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:11:53 GMT)
Mind The Edge: Refining Depth Edges in Sparsely-Supervised Monocular Depth Estimation [42.2] 単眼深度推定(MDE)はコンピュータビジョンの基本的な問題であり、多くの応用がある。
本稿では,密集した合成データから深度エッジの位置を検出することを提案する。
いくつかの挑戦的データセットに対して,画素ごとの深度精度を比較検討することにより,深度エッジの精度が著しく向上したことを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:03:52 GMT)
Forecasting Electricity Market Signals via Generative AI [42.0] 本稿では,電気市場信号の確率予測のための生成人工知能アプローチを提案する。
リアルタイム市場運用における動的・揮発性時系列の3つの応用について考察する。
複数の独立系オペレーターの市場データに基づく数値的研究は,提案した生成予測器の優れた性能を示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 00:44:52 GMT)
On the Multilingual Ability of Decoder-based Pre-trained Language Models: Finding and Controlling Language-Specific Neurons [37.3] 多言語デコーダを用いた言語モデル(PLM)のニューロンレベルの内部挙動の解析
言語固有のニューロンは、言語間でわずかに重なり(5%)、ユニークであることを示す。
推論中に各モデルにおける全ニューロンの1%未満をタンパし、少数の言語特異的ニューロンとのタンパリングがテキスト生成におけるターゲット言語発生の確率を劇的に変化させることを実証した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:37:22 GMT)
SalFoM: Dynamic Saliency Prediction with Video Foundation Models [37.3] ビデオサリエンシ予測(VSP)は人間の視覚システムと比較して有望な性能を示した。
本稿では,新しいエンコーダデコーダビデオトランスアーキテクチャであるSalFoMを紹介する。
本モデルはUnMasked Teacher(UMT)抽出器を使用し,異種デコーダを意識した時間変換器を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 22:38:54 GMT)
Explainable Traffic Flow Prediction with Large Language Models [36.6] 本研究は,より直接的かつ合理的な予測を目的とした,交通予測のための基礎モデルに基づく説明可能な手法であるTP-LLMを紹介する。
また、TP-LLMは、より確実な予測のために入力依存性の説明を生成することができ、同様のフレームワークでゼロショット予測を行うため、異なる都市力学に容易に一般化することができる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:14:15 GMT)
G3DR: Generative 3D Reconstruction in ImageNet [36.3] 本稿では,新しい3D生成手法であるジェネレーティブ3Dレコンストラクション(G3DR)をImageNetに導入する。
G3DRは単一画像から多種多様な高品質の3Dオブジェクトを生成することができる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:42:11 GMT)
Enhancing Low-Resource LLMs Classification with PEFT and Synthetic Data [36.1] 大規模言語モデル(LLMs)は、テキスト分類タスクにおいて、0ショットまたは数ショットの設定で動作する。
In-Context Learning (ICL) は通常、0ショット設定よりも精度が高いが、入力のプロンプトが長くなるため、効率性は高い。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:24:19 GMT)
The Audio-Visual Conversational Graph: From an Egocentric-Exocentric Perspective [36.1] 本稿では,Ego-Exocentric Conversational Graph Prediction問題を紹介する。
統合型マルチモーダルフレームワーク -AV-CONV(Audio-Visual Conversational Attention)を提案する。
具体的には、時間、オブジェクト間、モダリティ間の表現をモデル化するために、自己認識メカニズムを採用します。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:11:17 GMT)
Hybrid Video Diffusion Models with 2D Triplane and 3D Wavelet Representation [35.5] 複雑な依存関係をより効率的にキャプチャできるHVtemporalDMというハイブリッドビデオオートエンコーダを提案する。
HVDMは、ビデオの歪んだ表現を抽出するハイブリッドビデオオートエンコーダによって訓練される。
当社のハイブリッドオートエンコーダは、生成されたビデオに詳細な構造と詳細を付加した、より包括的なビデオラテントを提供します。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:03:35 GMT)
Dynamic Demonstration Retrieval and Cognitive Understanding for Emotional Support Conversation [35.5] ESCにおける2つの重要な課題は、文脈的関連性および共感的応答生成の促進と認知的理解の促進である。
私たちの仕事は、ESCで提供されるサポートの品質を改善するためにこれらの要素を相乗化するための新しいアプローチです。
私たちのコードは、さらなる研究と開発を促進するために、パブリックアクセスが可能です。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:47:15 GMT)
A Universal Deep Neural Network for Signal Detection in Wireless Communication Systems [35.1] 無線通信におけるチャネル推定と信号検出のための有望なアプローチとして,Deep Learning (DL) が登場している。
無線チャネルの動的性質に対処するためには、新しい非老化データに基づいてDL手法を再訓練する必要がある。
本稿では,モデルを再学習することなく,様々な無線環境において高い検出性能を達成できる,新しいユニバーサルディープニューラルネットワーク(Uni-DNN)を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:21:10 GMT)
Cross-Modal Conditioned Reconstruction for Language-guided Medical Image Segmentation [35.1] 本稿では,言語誘導医療画像(RecLMIS)を提案する。
実験では、公開されているMosMedData+データセット上で、LViTを3.74%のmIoUで上回り、RecLMISの優位性を実証した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:23:37 GMT)
CAPE: CAM as a Probabilistic Ensemble for Enhanced DNN Interpretation [35.0] クラスアクティベーションマップ(CAM)と最近の変種は、ディープニューラルネットワーク(DNN)決定過程を視覚的に説明する方法を提供する。
本稿では,画像領域のコントリビューションを統一的かつ確率的に有意義に評価できるCAPEを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 01:13:05 GMT)
AllHands: Ask Me Anything on Large-scale Verbatim Feedback via Large Language Models [34.8] Allhandsは、自然言語インタフェースによる大規模なフィードバック分析のために設計された革新的な分析フレームワークである。
LLMは、精度、堅牢性、一般化、ユーザフレンドリー性を高める大きな言語モデルである。
Allhandsは、テキスト、コード、テーブル、イメージを含む、包括的なマルチモーダルレスポンスを提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:46:51 GMT)
Design2Cloth: 3D Cloth Generation from 2D Masks [34.8] 我々は2000以上の被験者スキャンから実世界のデータセットをトレーニングした高忠実度3D生成モデルであるDesign2Clothを提案する。
定性的かつ定量的な実験のシリーズでは、Design2Clothが現在の最先端の織物生成モデルよりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:32:13 GMT)
Utilizing Quantum Processor for the Analysis of Strongly Correlated Materials [34.6] 本研究では,従来の量子クラスター法を量子回路モデルに適用することにより,強い相関関係を解析するための体系的アプローチを提案する。
我々は、クラスタのグリーン関数を計算するためのより簡潔な公式を開発し、複雑な演算ではなく、量子回路上の実数計算のみを必要とする。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:53:48 GMT)
LLaFS: When Large Language Models Meet Few-Shot Segmentation [32.9] LLaFSは,大規模言語モデル(LLM)を数発のセグメンテーションで活用するための最初の試みである。
LLaFSは、アノテーション付きサポート画像からの制限された情報とバイアスのある情報のみに依存する従来の数ショットセグメンテーション法とは対照的に、LLMを直接使用して数ショットで画像のセグメンテーションを行う。
LLaFSは複数のデータセットで最先端の結果を達成し、数ショットのコンピュータビジョンタスクにLLMを使用する可能性を示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:08:08 GMT)
Generating Images with 3D Annotations Using Diffusion Models [32.8] 拡散モデルに3次元幾何制御を組み込んだ3次元拡散スタイル転送(3D-DST)を提案する。
提案手法は,テキストプロンプトに加えて視覚的プロンプトを用いて拡散モデルを拡張する制御ネットを利用する。
明示的な3次元幾何制御により、生成画像中のオブジェクトの3次元構造を容易に変更し、グラウンドトルース3Dを自動的に得ることができる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:16:02 GMT)
Freditor: High-Fidelity and Transferable NeRF Editing by Frequency Decomposition [32.7] 最近のNeRF編集パイプラインは、ぼやけた結果に悩まされながら、3Dシーンに2Dスタイリング結果を持ち上げる。
本稿では,高周波分解による高忠実かつ転写可能なNeRF編集を実現する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:07:02 GMT)
End-To-End Self-tuning Self-supervised Time Series Anomaly Detection [32.7] 時系列異常検出(TSAD)は、環境センサ、産業タイプ、患者バイオマーカーなど、多くの応用を見出す。
TSADの2倍の課題は、様々な種類の時系列異常を検出できる汎用的で教師なしのモデルである。
TSAP for TSA "on autoPilot"を導入します。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:57:26 GMT)
IndiBias: A Benchmark Dataset to Measure Social Biases in Language Models for Indian Context [32.5] インドにおける社会的バイアスを評価するためのベンチマークデータセットであるIndiBiasを紹介する。
バイアスの次元には、性別、宗教、キャスト、年齢、地域、身体的外観、職業が含まれる。
我々のデータセットには800の文対と300の偏差測定が含まれている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:59:19 GMT)
Stochastic Constrained Decentralized Optimization for Machine Learning with Fewer Data Oracles: a Gradient Sliding Approach [32.4] 機械学習モデルでは、アルゴリズムはその勾配のためにデータセンターとサンプルデータに通信する必要がある。
これにより、通信効率が良く、勾配計算の数を最小限に抑える分散最適化アルゴリズムの必要性が生じる。
通信効率が高く,$varepsilon$-approximate のソリューションを実現する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:55:59 GMT)
Psychometric Predictive Power of Large Language Models [32.3] そこで本研究では,認知モデルの観点から,命令チューニングが必ずしも大きな言語モデルを作るとは限らないことを示す。
命令調整 LLM で推定される次の単語確率は、基本 LLM で推定されるものよりも、人間の読み動作をシミュレートする場合には、しばしば悪化する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:45:45 GMT)
MI-NeRF: Learning a Single Face NeRF from Multiple Identities [31.8] 本研究では,複数の人物の顔映像から単一動的神経放射場(NeRF)を学習する手法を提案する。
本稿では,表情伝達と音声合成の両面での結果について述べる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:48:47 GMT)
Exploring Backdoor Vulnerabilities of Chat Models [31.8] 近年の研究では、LLM(Large Language Models)がバックドアアタック(Backdoor Attack)と呼ばれるセキュリティの脅威を受けやすいことが示されている。
本稿では,異なるラウンドのユーザ入力に対して複数のトリガシナリオを分散することで,チャットモデルに対する新たなバックドア攻撃手法を提案する。
実験により,チャットモデルの正常な性能を維持しつつ,高い攻撃成功率を達成できることが実証された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:16:53 GMT)
EDT: Improving Large Language Models' Generation by Entropy-based Dynamic Temperature Sampling [31.7] 生成品質と多様性のバランスをとるために,効率的なエントロピーに基づく動的温度サンプリング法を提案する。
我々の実験によると、EDTは様々なタスクで既存の戦略を著しく上回ります。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:09:22 GMT)
Affective-NLI: Towards Accurate and Interpretable Personality Recognition in Conversation [30.8] 会話におけるパーソナリティ認識(PRC)は、テキスト対話コンテンツを通して話者の性格特性を識別することを目的としている。
本稿では,PRCの正確かつ解釈可能なAffective Natural Language Inference (Affective-NLI)を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:14:24 GMT)
A Robust Ensemble Algorithm for Ischemic Stroke Lesion Segmentation: Generalizability and Clinical Utility Beyond the ISLES Challenge [30.6] 画像と疾患の多様性は、臨床価値を持つ一般化可能なAIアルゴリズムの開発を妨げる。
2022 Ischemic Stroke Lesion (ISLES) から得られた新しいアンサンブルアルゴリズムを提案する。
トップパフォーマンスのアルゴリズムを、個々のソリューションの限界を克服するアンサンブルモデルに組み合わせました。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:37:32 GMT)
DeiT-LT Distillation Strikes Back for Vision Transformer Training on Long-Tailed Datasets [30.2] Vision Transformer (ViT) は様々なコンピュータビジョンタスクの顕著なアーキテクチャとして登場した。
ViTは事前トレーニングに大量のデータを必要とする。
DeiT-LTを導入し、長い尾のデータセットのスクラッチからViTをトレーニングする問題に対処する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:58:21 GMT)
Lifelong Event Detection with Embedding Space Separation and Compaction [30.1] 既存のイベント検出方法は、通常、メモリモジュールを保持し、新しいタスクの学習中に記憶されたメモリデータを再生する。
メモリデータと新しいタスクサンプルの単純な組み合わせは、以前取得した知識をかなり忘れてしまう可能性がある。
本稿では,空間分離とコンパクト化に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:51:49 GMT)
Retro-fallback: retrosynthetic planning in an uncertain world [29.4] 再合成は、よりシンプルで購入可能な分子から望ましい分子を作るために一連の化学反応を計画するタスクである。
本稿では,この不確実性を考慮したレトロ合成の新規な定式化を提案する。
そこで我々は,少なくとも1つの計画が実験室で実行可能である確率を最大化する,レトロフォールバック(retro-fallback)と呼ばれる新しいグリージーアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:17:57 GMT)
Whispers of Doubt Amidst Echoes of Triumph in NLP Robustness [29.3] a)ドメイン外のテストセットとチャレンジテストセット、(b)CheckListによる振る舞いテスト、(c)コントラストセット、(d)逆入力を用いて評価を行う。
我々はNLPにおけるロバスト性の問題が未解決であるだけでなく、ロバスト性を測定するアプローチも再評価する必要があると結論付けている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:07:45 GMT)
Towards Responsible Generative AI: A Reference Architecture for Designing Foundation Model based Agents [28.4] ファンデーションモデルに基づくエージェントは、ファンデーションモデルの能力から自律性を引き出す。
本稿では,基礎モデルに基づくエージェントの設計におけるガイダンスとして機能するパターン指向参照アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:13:38 GMT)
Learn to Disguise: Avoid Refusal Responses in LLM's Defense via a Multi-agent Attacker-Disguiser Game [28.3] 悪意のある攻撃者は大規模なモデルを誘導して脱獄させ、違法なプライバシー侵害情報を含む情報を生成する。
大規模なモデルは、安全アライメントのような技術を使って悪意ある攻撃者の攻撃に対処する。
本研究では,攻撃者に対して安全に応答し,防御意図を隠蔽する,弱い防御機構を実現するためのマルチエージェント攻撃ゲーム手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:43:11 GMT)
MARL-LNS: Cooperative Multi-agent Reinforcement Learning via Large Neighborhoods Search [27.8] 本稿では,エージェントのサブセットを交互にトレーニングすることで,問題に対処するための一般的なトレーニングフレームワークであるMARL-LNSを提案する。
我々のアルゴリズムは、トレーニング時間の少なくとも10%を自動で削減し、元のアルゴリズムと同じ最終スキルレベルに到達できることを示します。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 22:51:54 GMT)
Investigating Data Contamination in Modern Benchmarks for Large Language Models [27.5] 近年の観測は、膨らませたベンチマークスコアとLLMの実際の性能の相違を裏付けている。
我々は,オープンソースのLLMとプロプライエタリなLLMの両方に適した2つの手法を提案し,データ汚染について検討した。
いくつかの商用LCMは、様々なテストセットに欠けているオプションを驚くほど推測できる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 23:29:03 GMT)
ViTamin: Designing Scalable Vision Models in the Vision-Language Era [26.9] Vision Transformer (ViTs) は、イメージエンコーダのデフォルトの選択肢である。
ViTamin-Lは、ViT-Lを2.0%画像ネットゼロショット精度で大幅に上回る。
436万のパラメータしか持たないViTamin-XLは、82.9%のImageNetゼロショット精度を実現している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:45:02 GMT)
Efficient and Scalable Graph Generation through Iterative Local Expansion [26.8] 本稿では,1ノードを対象グラフに段階的に拡張することで,グラフを生成する手法を提案する。
各ステップにおいて、ノードとエッジは拡散を減らし、まずグローバル構造を構築し、次に局所的な詳細を精査することで局所的に追加される。
提案モデルは,5,000ノード以上のグラフへのスケーリングを成功裏に,確立されたベンチマークデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:52:07 GMT)
Put Your Money Where Your Mouth Is: Evaluating Strategic Planning and Execution of LLM Agents in an Auction Arena [25.9] オークションをシミュレートする新しい評価スイートであるAucArenaを紹介する。
我々は,最先端の大規模言語モデル(LLM)を用いて,入札エージェントによる計画と実行スキルのベンチマークを行う制御実験を行う。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:37:56 GMT)
Put Your Money Where Your Mouth Is: Evaluating Strategic Planning and Execution of LLM Agents in an Auction Arena [25.9] オークションをシミュレートする新しい評価スイートであるAucArenaを紹介する。
我々は,最先端の大規模言語モデル(LLM)を用いて,入札エージェントによる計画と実行スキルのベンチマークを行う制御実験を行う。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:37:56 GMT)
Knowledge Distillation with Multi-granularity Mixture of Priors for Image Super-Resolution [25.6] 本研究は,KDPKフレームワークのマルチグラニュラリティ混合であるMIDPKを示し,高効率な画像超解像モデルを実現する。
提案手法の有効性を示す実験を行った。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:47:40 GMT)
Semi-Supervised Unconstrained Head Pose Estimation in the Wild [25.5] そこで本研究では,最初の半教師なし頭部ポーズ推定手法を提案する。
SemiUHPEは、フロントレンジとフルレンジの両方で、公開ベンチマークの大幅な改善により、SOTAを上回ることができる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:01:00 GMT)
FreeMan: Towards Benchmarking 3D Human Pose Estimation under Real-World Conditions [25.4] FreeManは、現実世界の条件下で収集された最初の大規模なマルチビューデータセットである。
8000のシーケンスから1100万フレームで構成され、異なる視点から見ることができます。
これらのシーケンスは、10の異なるシナリオにまたがって40の被験者をカバーし、それぞれ異なる照明条件を持つ。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:07:55 GMT)
Strengthening Multimodal Large Language Model with Bootstrapped Preference Optimization [25.3] MLLM(Multimodal Large Language Models)は、視覚的な入力に基づいて応答を生成する。
彼らはしばしば、事前学習したコーパスと同様の反応を生み出すバイアスに悩まされ、視覚情報の重要性を誇示する。
我々は、このバイアスを事前学習統計のための"推奨"として扱い、視覚入力におけるモデルの基盤を妨げます。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:22:23 GMT)
Deep Reinforcement Learning for Traveling Purchaser Problems [25.3] 旅行購入問題(TPP)は幅広いアプリケーションにおいて重要な最適化問題である。
本稿では,ルート構築と購入計画を個別に扱う,深層強化学習(DRL)に基づく新しいアプローチを提案する。
メタラーニング戦略を導入することで、大規模なTPPインスタンス上で安定してポリシーネットワークをトレーニングすることができる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:32:10 GMT)
Head-to-Tail: How Knowledgeable are Large Language Models (LLMs)? A.K.A. Will LLMs Replace Knowledge Graphs? [24.9] Head-to-Tailは、ヘッド、トーソ、テールファクトに関する18Kの質問対で構成されるベンチマークである。
既存のLSMは、特に胴体と尾部の実体の事実において、事実知識の把握の観点からはまだ完璧ではないことを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 00:25:39 GMT)
JailBreakV-28K: A Benchmark for Assessing the Robustness of MultiModal Large Language Models against Jailbreak Attacks [24.7] 本稿では,大規模言語モデルのジェイルブレイクを成功させる手法が,MLLMのジェイルブレークに等しく有効かどうかを検討する。
MLLM への LLM ジェイルブレイク手法の転送性を評価するための先駆的なベンチマークである JailBreakV-28K を紹介する。
LLMの高度なジェイルブレイク攻撃と、最近のMLLMのジェイルブレイク攻撃によるイメージベースのジェイルブレイク入力により、20000のテキストベースのジェイルブレイクプロンプトを生成します。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:23:18 GMT)
Improved Zero-Shot Classification by Adapting VLMs with Text Descriptions [24.6] 我々は,視覚言語モデル(VLM)を「バグレベル」の画像テキスト管理で訓練する手法を開発した。
我々は,大規模言語モデル(LLM)によって生成されたカテゴリと,豊富な,きめ細かい画像分類データセットを用いて記述する。
以上の結果から,地理的先行は視覚的外観と同等に有効である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 22:23:25 GMT)
Towards Generalizable and Faithful Logic Reasoning over Natural Language via Resolution Refutation [24.6] 本稿では,GFaiR(Generalizable and Faithful Reasoner)という新しいフレームワークを提案する。
解法の難解化は、推論規則を拡張し、矛盾による証明の原理を採用することによって、全ての一階論理推論問題を解く能力を持つ。
我々のシステムは、単純なシナリオでパフォーマンスを維持しながら、複雑なシナリオで最先端のパフォーマンスを達成することで、これまでの作業より優れています。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:28:31 GMT)
Your Student is Better Than Expected: Adaptive Teacher-Student Collaboration for Text-Conditional Diffusion Models [24.4] 教師のテキスト・画像拡散モデルによるサンプルの相対的品質とその蒸留された学生版について検討する。
学生と教師の拡散モデルによる効果的なテキスト・画像合成のための適応的協調手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:00:18 GMT)
A Recommender System for NFT Collectibles with Item Feature [24.2] 本稿では,さまざまなデータソースを用いて高精度なレコメンデーションを生成するNFTのためのレコメンデーションシステムを提案する。
本研究では,データ効率のよいグラフベースのレコメンデーションシステムを構築し,各項目とユーザ間の複雑な関係を効率的に把握する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:52:50 GMT)
Model-agnostic Origin Attribution of Generated Images with Few-shot Examples [24.0] 本研究では,生成した画像の起点属性を現実的に検討する。
ゴールは、ある画像がソースモデルによって生成されるかどうかを確認することである。
OCC-CLIPはCLIPをベースとしたワンクラス分類のためのフレームワークである。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:54:16 GMT)
MaiNLP at SemEval-2024 Task 1: Analyzing Source Language Selection in Cross-Lingual Textual Relatedness [23.9] 本稿では,SemEval-2024 Task 1: Semantic Textual Relatedness (STR) on Track C: Cross-lingualについて述べる。
本課題は,目的言語における2つの文の意味的関連性を検出することを目的としている。
私たちの提出は、C8テストセット(Kinyarwanda)で1位を獲得しました。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:44:51 GMT)
PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large Language Models [23.9] PEFT法,主特異値および特異ベクトル適応(PiSSA)を導入する。
PiSSA は Intrinsic SAID にインスパイアされており、これは事前訓練された過度にパラメータ化されたモデルが低内在次元の空間に存在することを示唆している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:06:43 GMT)
AlpaCare:Instruction-tuned Large Language Models for Medical Application [23.7] GPT-4 と ChatGPT を用いた多種多様な医療用 IFT データセット MedInstruct-52k の作成を提案する。
次に、データセット上のLLaMA系列モデルを微調整してAlpaCareを開発する。
ドメイン固有のデータセットが小さいにもかかわらず、AlpaCareは医療アプリケーションで優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:36:08 GMT)
Conifer: Improving Complex Constrained Instruction-Following Ability of Large Language Models [23.2] 大規模言語モデルのための命令チューニングデータセットであるConiferを紹介する。
複雑な制約のある命令に従うために、Coniferでモデルをトレーニングします。
いくつかのインストラクション追従ベンチマークでは、我々の7Bモデルは最先端のオープンソース7Bモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:55:39 GMT)
Convergence Guarantees for RMSProp and Adam in Generalized-smooth Non-convex Optimization with Affine Noise Variance [23.1] 我々はまず,適応学習率を持つAdamの特殊なケースであるRMSPropを分析する。
我々は、勾配ノルムの関数でもある降下補題において、新しい上界一階項を開発する。
RMSPropとAdamの両者の結果は、citearvani2023lowerで確立された複雑さと一致した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:08:40 GMT)
Masked Completion via Structured Diffusion with White-Box Transformers [23.1] 大規模教師なし表現学習に適用可能なホワイトボックス設計パラダイムの最初のインスタンス化を提供する。
我々は、拡散、圧縮、および(マスクされた)完了の基本的な接続を利用して、ディープトランスフォーマーのようなマスク付きオートエンコーダアーキテクチャを導出する。
CRATE-MAEは、大規模データセット上で非常に有望なパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:23:01 GMT)
Think While You Write: Hypothesis Verification Promotes Faithful Knowledge-to-Text Generation [22.8] 知識からテキストへのジェネレータは、しばしば入力された事実に関する記述を忠実に生成するのに苦労する。
幻覚を抑えるため,任意のジェネレータと組み込むことができるTWEAK(Think While Effectively Articulating Knowledge)を提案する。
TWEAKは、各デコードステップとその将来のシーケンスで生成されたシーケンスを仮説として扱い、それらの仮説が入力事実によって支持される範囲に基づいて、各生成候補をランク付けする。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:02:33 GMT)
Automatic Prompt Selection for Large Language Models [22.7] 本稿では,与えられた入力に対する最適プロンプトを,有限個の合成候補プロンプトから自動的に選択する効果的な手法を提案する。
本手法は,資源集約型トレーニングと推論の必要性を排除し,汎用性に即したバランスをとる。
GSM8K、MultiArithm、AQuAといったゼロショット質問回答データセット上での競合性能を示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:20:24 GMT)
Optimizing Diffusion Noise Can Serve As Universal Motion Priors [22.2] ディフュージョンノイズ最適化(DNO)は,既存の動き拡散モデルを広範囲な動作関連タスクの先行動作として効果的に活用する新しい手法である。
動作の編集と制御において、DNOは目標達成と動作内容の保存の両方において既存の手法より優れている。
DNOは運動の雑音化と完了に有効であり、雑音や部分的な入力から滑らかで現実的な動きを生み出す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:07:50 GMT)
Tensor-based Graph Learning with Consistency and Specificity for Multi-view Clustering [20.9] 一貫性と特異性を同時に検討する新しい多視点グラフ学習フレームワークを提案する。
我々は、ノイズフリーグラフ融合のための新しいテンソルベースのターゲットグラフ学習パラダイムを定式化する。
6つのデータセットの実験により,本手法の優位性を実証した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:26:05 GMT)
Deep Privacy Funnel Model: From a Discriminative to a Generative Approach with an Application to Face Recognition [20.6] 顔認識の領域に情報理論プライバシ・ファンネル(PF)モデルを適用する。
エンド・ツー・エンドのトレーニング・フレームワーク内にプライバシ保護表現学習のための新しい手法を開発する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:50:45 GMT)
ASAP: Interpretable Analysis and Summarization of AI-generated Image Patterns at Scale [20.1] 生成画像モデルは、現実的な画像を生成するための有望な技術として登場してきた。
ユーザーがAI生成画像のパターンを効果的に識別し理解できるようにするための需要が高まっている。
我々はAI生成画像の異なるパターンを自動的に抽出する対話型可視化システムASAPを開発した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:20:41 GMT)
Rethinking Kullback-Leibler Divergence in Knowledge Distillation for Large Language Models [20.0] Kullback-Leiber分散は、Large Language Models (LLM) の圧縮に知識蒸留 (KD) で広く使われている。
以前のアサーションとは対照的に、逆クルバック・リブラー(英語版)(RKL)の発散はモード探索であり、したがって平均シーキング前方クルバック・リブラー(英語版)(FKL)の発散よりも好ましい。
本稿では,FKLとRKLを組み合わせるために重みを適応的に割り当てる,単純で効果的な適応型Kulback-Leiber(AKL)分散法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:40:17 GMT)
Neural Radiance Fields with Torch Units [19.9] 学習に基づく3D再構成法は産業用途に広く用いられている。
本稿では,よりコンテキスト情報を持つ単一カメラ光線を奨励する新しい推論パターンを提案する。
トーチライトとして、画像のパッチを描画する手法の光線を要約するため、提案手法をTorch-NeRFと呼ぶ。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:08:55 GMT)
Model Compression in Practice: Lessons Learned from Practitioners Creating On-device Machine Learning Experiences [19.2] 私たちはAppleの30のエキスパートに、効率的なモデルの製造を専門にインタビューした。
我々の発見は、先行研究から欠落した現実的な考察を提供する。
この作業の難易度を高めるため、ツールの設計勧告を精査する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:29:05 GMT)
Improving Medical Reasoning through Retrieval and Self-Reflection with Retrieval-Augmented Large Language Models [19.0] Self-BioRAGは、説明文の生成、ドメイン固有の文書の検索、生成したレスポンスの自己参照を専門とする、バイオメディカルテキストに信頼できるフレームワークである。
84kのバイオメディカル・インストラクション・セットを用いて、カスタマイズされた反射トークンで生成された説明を評価できるセルフビオRAGを訓練する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 01:27:20 GMT)
Tightly-Coupled LiDAR-IMU-Wheel Odometry with Online Calibration of a Kinematic Model for Skid-Steering Robots [18.9] トンネルと長い廊下は、これらの環境でLiDARポイントクラウドが縮退するので、移動ロボットにとって困難な環境である。
本研究では,スキッドステアリングロボットのオンラインキャリブレーションを用いた,密結合型LiDAR-IMUホイールオドメトリーアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:07:29 GMT)
Maximal quantum interaction between free electrons and photons [18.5] 自由電子量子光学は電子-光子絡み合いを可能にし、非自明な光子状態を生成するポテンシャルを保持する。
我々は、自由電子と単一モード光子の間の量子真空相互作用強度に上限を与え、最も強い相互作用の条件を照らす。
標準測地解析および数値計算によりその限界を検証し、強い量子相互作用の実現可能性を示す準最適設計を提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:33:05 GMT)
Unleashing the Potential of Large Language Models for Predictive Tabular Tasks in Data Science [17.9] この研究は、これらの予測タスクにLarge Language Models (LLM)を適用する試みである。
本研究の目的は,Llama-2 の大規模学習を行う上で,注釈付きテーブルの包括的コーパスをコンパイルすることで,このギャップを緩和することにある。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:23:27 GMT)
Language Models as Compilers: Simulating Pseudocode Execution Improves Algorithmic Reasoning in Language Models [17.8] 本稿では,言語モデルの推論過程を2段階に分解するフレームワークであるThink-and-Executeについて述べる。
7つのアルゴリズム的推論タスクについて広範な実験を行い、思考と実行の有効性を実証する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:49:11 GMT)
Continual Learning of Numerous Tasks from Long-tail Distributions [17.7] 継続的な学習は、以前獲得した知識を維持しながら、新しいタスクを学習し、適応するモデルの開発に焦点を当てる。
既存の連続学習アルゴリズムは、通常、一定の大きさの少数のタスクを伴い、現実世界の学習シナリオを正確に表現しないことがある。
本稿では,従来のタスクから第2モーメントの重み付け平均を維持することで,アダムの状態を再利用する手法を提案する。
提案手法は,既存のほとんどの連続学習アルゴリズムと互換性があり,少ない計算量やメモリコストで忘れを効果的に削減できることを実証する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:56:33 GMT)
A Differentiable Integer Linear Programming Solver for Explanation-Based Natural Language Inference [17.5] 我々は、説明に基づく自然言語推論(NLI)のためのニューロシンボリックアーキテクチャであるDiff-Comb Explainerを紹介する。
Diff-Comb Explainerは、意味的制約の連続的な緩和を必要とせず、直接的でより正確で効率的な神経表現をILPの定式化に組み込むことができる。
Diff-Comb Explainer は従来の ILP ソルバ, ニューロシンボリックブラックボックスソルバ, トランスフォーマーベースのエンコーダと比較して優れた性能を示した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:29:06 GMT)
Event Camera Demosaicing via Swin Transformer and Pixel-focus Loss [17.4] RAW領域処理における画素値の欠落を解消するための,Swin-Transformerベースのバックボーンと画素焦点損失関数を提案する。
提案手法は,マルチスケール処理とスペース・ツー・ディープス技術を利用して,効率の確保と計算複雑性の低減を図る。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:30:56 GMT)
Understanding the Learning Dynamics of Alignment with Human Feedback [17.4] 本稿では,人間の嗜好アライメントの学習力学を理論的に解析する試みについて述べる。
選好データセットの分布がモデル更新率にどのように影響するかを示し、トレーニング精度に厳密な保証を与える。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:30:03 GMT)
Foundation Models for Structural Health Monitoring [17.4] 本稿では,トランスフォーマーニューラルネットワークをMasked Auto-Encoderアーキテクチャを用いて,構造的健康モニタリングのための基礎モデルとして初めて利用することを提案する。
自己教師付き事前学習を通じて、複数の大規模データセットから一般化可能な表現を学習する能力を実証する。
本研究は,3つの運用用インダクトのデータを用いた基礎モデルの有効性を示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:32:44 GMT)
Causal Intervention for Subject-Deconfounded Facial Action Unit Recognition [17.3] 本稿では,主観的不変な顔行動単位認識のための因果推論フレームワークを提案する。
顔画像,被験者,潜伏AU意味関係,推定AU発生確率の因果関係を定式化する。
BP4DとdisFAという2つのAUベンチマークデータセットを用いて行った実験は、我々のCISの有効性を示した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:27:59 GMT)
BCAmirs at SemEval-2024 Task 4: Beyond Words: A Multimodal and Multilingual Exploration of Persuasion in Memes [17.1] 画像からの付加的な意味情報の影響とモダリティギャップを評価するためのキャプション生成ステップを導入する。
本モデルでは, テキストエンコーダとしてRoBERTa, 画像エンコーダとしてCLIPを微調整するために, GPT-4 生成キャプションとミームテキストを併用した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:17:43 GMT)
MolBind: Multimodal Alignment of Language, Molecules, and Proteins [17.0] MolBindは、コントラスト学習を通じて、複数のモダリティのためにエンコーダを訓練するフレームワークである。
MolBindは、幅広いタスクにわたって優れたゼロショット学習性能を示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 01:00:53 GMT)
On the Importance of Uncertainty in Decision-Making with Large Language Models [17.0] 自然言語を入力とする意思決定問題における不確実性の役割について検討する。
我々は、Laplace Approximation、Dropout、Epinetsなどの不確実性推定に異なる手法を採用する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:21:23 GMT)
AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.9] 構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。
我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。
次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:05:27 GMT)
Min-K%++: Improved Baseline for Detecting Pre-Training Data from Large Language Models [16.8] 我々は,トークンの確率を,語彙全体のカテゴリ分布の統計値で正規化するMin-K%++を提案する。
WikiMIAベンチマークでは、Min-K%++はMin-K%を一貫して改善し、参照ベースのメソッドと同等に動作する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:25:01 GMT)
Utilizing Maximum Mean Discrepancy Barycenter for Propagating the Uncertainty of Value Functions in Reinforcement Learning [16.8] 本稿では,不確実性伝播に対するワッサースタインQラーニング(WQL)を改善するために,最大平均離散Qラーニング(MMD-QL)を提案する。
深層ネットワークをMDD-QLに組み込んでMDDQ-Network(MMD-QN)を作成します。
Atariゲームに挑戦する実験の結果、MDD-QNはベンチマークの深いRLアルゴリズムと比較してよく機能していることが示された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:32:17 GMT)
High-dimensional scaling limits and fluctuations of online least-squares SGD with smooth covariance [16.7] オンライン最小二乗勾配 Descent (SGD) アルゴリズムの高次元スケーリング限界とゆらぎを導出する。
その結果, 平均二乗推定や予測誤差の制限や変動など, いくつかの応用が得られた。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:44:32 GMT)
Behind the Veil: Enhanced Indoor 3D Scene Reconstruction with Occluded Surfaces Completion [15.4] そこで本研究では,室内の3次元再構成法について述べる。
本手法は,閉鎖されたシーン表面を仕上げる作業に取り組み,完全な3次元シーンメッシュを実現する。
提案手法を3D完全ルームシーン(3D-CRS)とiTHORデータセットで評価した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:18:27 GMT)
Adjusting Interpretable Dimensions in Embedding Space with Human Judgments [15.3] 埋め込み空間は、性別、スタイルの形式性、さらにはオブジェクトの性質を示す解釈可能な次元を含む。
これらの次元を計算する標準的な方法は、シードワードの対比を使い、それらの上の差分ベクトルを計算する。
種に基づくベクトルと、単語が特定の次元に沿って落ちる場所の人間の評価からのガイダンスを組み合わせて、サイズや危険といったオブジェクト特性を予測する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:13:18 GMT)
Deep Generative Models through the Lens of the Manifold Hypothesis: A Survey and New Connections [15.2] 低次元データのモデリングにおいて,高次元確率の数値不安定性は避けられないことを示す。
次に、オートエンコーダの学習表現上のDGMは、ワッサーシュタイン距離をほぼ最小化するものとして解釈できることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:00:00 GMT)
Fast and Precise: Adjusting Planning Horizon with Adaptive Subgoal Search [15.2] 本稿では,アダプティブサブゴールサーチ(AdaSubS)を提案する。
到達不能なサブゴールを迅速にフィルタリングするために検証機構が使用される。
AdaSubSは3つの複雑な推論タスクにおいて階層的計画アルゴリズムを大幅に上回ることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:49:36 GMT)
Empowering Biomedical Discovery with AI Agents [15.1] 我々は「AI科学者」を懐疑的な学習と推論が可能なシステムとして想定する。
バイオメディカルAIエージェントは、人間の創造性と専門知識と、大規模なデータセットを分析するAIの能力を組み合わせる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:08:01 GMT)
Construction of Functional Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model [15.0] 本稿では,多分野の材料知識グラフであるFMKGについて紹介する。
FMKGは、名前、フォーミュラ、頭字語、構造/位相、プロパティ、記述子、合成、評価方法、アプリケーション、ドメインを含む9つの異なるラベルに分類する。
本研究は,実践的なテキストマイニングに基づく知識管理システムの基礎となる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:46:14 GMT)
Rethinking Teacher-Student Curriculum Learning through the Cooperative Mechanics of Experience [15.0] Teacher-Student Curriculum Learning (TSCL)は、人間の文化的伝達と学習からインスピレーションを得るカリキュラム学習フレームワークである。
TSCLにおける教師と学生の相互作用の基盤となるメカニズムを解析するために,データ中心の視点を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:55:17 GMT)
Data-Driven Goal Recognition Design for General Behavioral Agents [14.8] 汎用行動モデルを持つエージェントを考慮に入れた,目標認識設計のためのデータ駆動型アプローチを提案する。
私たちのアプローチは、与えられた環境とエージェントの振る舞いモデルに対して$textitwcd$を予測するために、機械学習モデルをトレーニングすることから始まります。
そこで我々は,様々な制約を満たす勾配に基づく最適化フレームワークを提案し,意思決定環境を最適化する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:38:22 GMT)
Utilizing Contextual Clues and Role Correlations for Enhancing Document-level Event Argument Extraction [14.7] 文書レベルのイベント引数抽出は,情報抽出分野において重要な課題である。
本稿では、CARLGという新しいフレームワークを紹介し、CCA(Contextual Clues Aggregation)とRLIG(Role-based Latent Information Guidance)の2つの革新的なコンポーネントについて紹介する。
次に、CARLGフレームワークを、現在の主流EAEアプローチの2つのタイプに基づいて、2つの変種にインスタンス化します。特に、我々のCARLGフレームワークは、1%未満の新しいパラメータを導入し、性能を著しく改善しています。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:41:05 GMT)
MLLMReID: Multimodal Large Language Model-based Person Re-identification [14.7] MLLM(Multimodal large language model)は多くのタスクにおいて満足な結果を得た。
本稿では、人物再識別(ReID)の課題に適合させる方法について検討する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:52:44 GMT)
Cherry on Top: Parameter Heterogeneity and Quantization in Large Language Models [14.5] その結果,チェリーのパラメータの小さな部分集合がモデル性能に非常に大きな影響を与えていることが判明した。
混合精度パラメータの最適化を統一する新しい量子化法であるCherryQを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:16:31 GMT)
Harnessing the Power of Large Vision Language Models for Synthetic Image Detection [14.4] 本研究では,合成画像識別における高度な視覚言語モデル(VLM)の有効性について検討した。
大規模VLMの頑健な理解能力を活用することにより,拡散モデルによる合成画像と真正画像の識別が目的である。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:27:54 GMT)
SayNav: Grounding Large Language Models for Dynamic Planning to Navigation in New Environments [14.2] SayNavは、Large Language Models(LLM)からの人間の知識を活用して、複雑なナビゲーションタスクを効率的に一般化する新しいアプローチである。
SayNavは最先端の結果を達成し、成功率の点で強烈な地道的な仮定でオラクルベースのベースラインを8%以上上回ります。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:53:45 GMT)
Federated Computing -- Survey on Building Blocks, Extensions and Systems [14.2] フェデレートコンピューティング(FC)は、個々のデータのプライバシを損なうことなく、協調的な処理を可能にすることで懸念に対処する。
FCは、フェデレートラーニング(FL)とフェデレートアナリティクス(FA)からなる。
現在の調査では、ドメイン固有のFLユースケースをキャプチャし、FCパイプライン内の個々のコンポーネントを個別に記述したり、分離したりしている。
本研究は, 基本構造, 拡張, アーキテクチャ, 環境, モチベーションを有するFCシステムの基盤構造を蒸留するための150以上の論文を調査する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:47:48 GMT)
Decongestion by Representation: Learning to Improve Economic Welfare in Marketplaces [14.1] 現代のオンラインマーケットプレースでは、価格は通常、売り手によって分散された方法で設定され、アイテムに関する情報は必然的に部分的である。
プラットフォームのパワーは、デフォルトでユーザに提示されるアイテムに関する情報のサブセットである表現を制御することに限定されます。
このことは、プラットフォームが混雑を減らし、社会的福祉を改善する表現を学習しようとする、代理表現による混雑の現在の研究を動機付けている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:22:29 GMT)
Enhancing Cross-lingual Sentence Embedding for Low-resource Languages with Word Alignment [14.0] 低リソース言語における言語間単語表現は、特に現在のモデルにおける高リソース言語における単語表現と一致していない。
そこで本研究では,既製の単語アライメントモデルを用いて,英語と低リソース言語8言語間の単語アライメントを明確にする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:58:53 GMT)
Conquering the Communication Constraints to Enable Large Pre-Trained Models in Federated Learning [13.9] フェデレートラーニング(FL)は、ローカルデバイス上の生データに一元的にアクセスすることなく、モデルの協調的なトレーニングを可能にするための、有望なパラダイムとして登場した。
最近の最先端の事前訓練モデルでは、より能力が高くなっているが、パラメータも増えている。
FLにおけるこれらの強力で容易に利用できる事前学習モデルが、通信負荷を同時に軽減しつつ優れた性能を達成するためのソリューションを見つけることができるだろうか?
具体的には,FedPEFTの性能を,クライアントの安定性,データ分散,プライバシ設定の違いによって体系的に評価する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:01:26 GMT)
A Quantum Algorithm Framework for Discrete Probability Distributions with Applications to Rényi Entropy Estimation [13.8] 離散確率分布の特性を推定するための統一量子アルゴリズムフレームワークを提案する。
我々のフレームワークは、$alpha$-R'enyi entropy $H_alpha(p)$を、少なくとも2/3$の確率で加算エラー$epsilon$内で推定する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:13:38 GMT)
Global and Local Prompts Cooperation via Optimal Transport for Federated Learning [13.7] 本稿では,FedOTP(Federated Prompts Cooperation via Optimal Transport)を提案する。
具体的には、各クライアントに対して、クライアント間のコンセンサス知識を抽出するグローバルなプロンプトと、クライアント固有のカテゴリ特性をキャプチャするローカルなプロンプトを学習する。
不均衡な最適輸送は、これらのプロンプトと局所的な視覚的特徴を整合させるために使用され、グローバルなコンセンサスと局所的なパーソナライゼーションのバランスを損なう。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:16:58 GMT)
Measuring Social Norms of Large Language Models [13.6] 本稿では,大規模言語モデルが社会規範を理解するかどうかを検証するための新たな課題を提案する。
我々のデータセットは、402のスキルと12,383の質問からなる、最大の社会的規範スキルのセットを特徴としている。
本研究では,大規模言語モデルに基づくマルチエージェント・フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:58:57 GMT)
Burst Super-Resolution with Diffusion Models for Improving Perceptual Quality [12.7] バーストLR画像を受け入れる以前のSRネットワークは、曖昧なSR画像を生成することが知られている決定論的方法で訓練される。
このようなぼやけた画像は知覚的に劣化しているので、我々は鋭い高忠実度境界を再構築することを目指している。
一方,提案手法では,初期バーストSR画像の再構成にバーストLR特性を用いる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:59:24 GMT)
RDumb: A simple approach that questions our progress in continual test-time adaptation [12.4] テスト時間適応(TTA)では、事前トレーニングされたモデルをデプロイ時にデータ配布を変更するように更新することができる。
近年の長期にわたる連続的適応手法の提案と適用方法が提案されている。
最終的には、最先端の1つのメソッド以外はすべて崩壊し、非適応モデルよりもパフォーマンスが悪くなることに気付きました。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:16:22 GMT)
Large Language Model for Vulnerability Detection and Repair: Literature Review and Roadmap [12.3] 現在、脆弱性の検出と修復にLarge Language Modelsの利用に焦点を当てた調査は行われていない。
このレビューは、SE、AI、およびセキュリティカンファレンスおよびジャーナルをリードする研究成果を含み、21の異なる会場で発行された36の論文をカバーしている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:27:33 GMT)
A School Student Essay Corpus for Analyzing Interactions of Argumentative Structure and Quality [12.2] 我々は,2つの年齢集団の学生のエッセイ1,320件のドイツ語コーパスを提示する。
各エッセイは、複数のレベルの粒度の議論的構造と品質のために手動で注釈付けされている。
議論マイニングとエッセイスコアリングのためのベースラインアプローチを提案し,両タスク間の相互作用を分析する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:31:53 GMT)
A Survey of Optimization-based Task and Motion Planning: From Classical To Learning Approaches [11.8] タスク・アンド・モーション・プランニング(TAMP)は、高レベルなタスク計画と低レベルなモーション・プランニングを統合し、ロボットに自律性を持たせ、長期にわたる動的タスクを推論する。
この調査では、最適化に基づくTAMPの包括的なレビュー、(i)計画ドメイン表現、(ii)AI計画と軌道最適化(TO)を含むコンポーネントの個別ソリューション戦略、(iii)論理ベースのタスク計画とモデルベースのTOの動的相互作用について紹介する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:38:36 GMT)
Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification [11.8] 本研究は,グラフストリーム分類の新しい手法を提案する。
データ生成プロセスは、時間とともにさまざまなノードとエッジを持つグラフを生成する。
ドリフトの検出時にグラフプロトタイプを再計算するために、ロスベースのコンセプトドリフト検出機構が組み込まれている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:47:32 GMT)
eWand: A calibration framework for wide baseline frame-based and event-based camera systems [11.7] 印刷または表示されたパターンの代わりに不透明な球体内でLEDを点滅させる新しい方法であるeWandを提案する。
本手法は,イベントベースカメラとフレームベースカメラの両方において,高精度なキャリブレーション手法を実現する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:47:15 GMT)
MatAtlas: Text-driven Consistent Geometry Texturing and Material Assignment [11.7] MatAtlasは、一貫したテキスト誘導3Dモデルのための方法である。
多段階のテクスチャリファインメントプロセスを提案することにより、品質と一貫性を著しく改善する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:57:15 GMT)
CSEPrompts: A Benchmark of Introductory Computer Science Prompts [11.7] AI、機械学習、NLPの最近の進歩は、新しい世代のLarge Language Models(LLM)の開発に繋がった。
商業的応用により、この技術は一般大衆に利用できるようになったため、学術的および専門的な目的のために高品質なテキストを作成するためにLLMを使用することが可能である。
学校や大学は、学生によるAI生成コンテンツの利用の増加に気づいており、この新しい技術とその潜在的な誤用の影響を調査している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:55:57 GMT)
Structured Packing in LLM Training Improves Long Context Utilization [11.5] この研究は、意味的相互依存を高めるためのトレーニングデータの構造化が、文脈利用の最適化に有効な戦略であることを示している。
本研究では、情報検索手法を用いて、相互に関連のある文書を単一の学習コンテキストに照合することで、トレーニング例を作成する方法であるStructured Packing for Long Context (SPLiCe)を紹介する。
我々はSPLiCeを大規模な3$Bと7$Bのモデルで実証的に検証し、より複雑な改善と下流タスクにおける長期使用率の向上を示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:35:11 GMT)
Octopus v2: On-device language model for super agent [11.0] 本研究は,GPT-4の性能を精度とレイテンシの両方で上回る20億のパラメータを持つデバイスモデルを実現するための新しい手法を提案する。
Llama-7BをRAGベースの関数呼び出し機構で比較すると,レイテンシを35倍に向上する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:40:17 GMT)
A Continued Pretrained LLM Approach for Automatic Medical Note Generation [11.0] HEALは13B LLaMA2をベースとしたLLMで, 医療会話用に構築され, 自動切削で測定される。
以上の結果から, HEALはPubMedQAにおいてGPT-4, PMC-LLaMAよりも78.4%優れていた。
興味深いことに、HEALはGPT-4とMed-PaLM 2を越え、より正確な医療概念を同定し、正確性と完全性においてヒトの書記体のパフォーマンスを上回る。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:08:30 GMT)
A Unified Membership Inference Method for Visual Self-supervised Encoder via Part-aware Capability [10.8] 自己指導型学習は、特にビジョンにおいて、重要なプライバシー上の懸念に直面している。
本稿では、PartCropと呼ばれる統一メンバーシップ推論手法を提案する。
我々は、異なるトレーニングプロトコルと構造を持つ自己教師型モデルに対して、広範囲にわたる攻撃を行う。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:04:55 GMT)
Decentralised Moderation for Interoperable Social Networks: A Conversation-based Approach for Pleroma and the Fediverse [10.8] 本稿では,分散化された対話型コンテンツモデレーション手法を提案する。
当社のアプローチでは,各サーバ上でローカルにトレーニングされたグラフ深層学習モデル(GraphNLI)を採用している。
本モデルでは, 局所的なポスト情報を用いて学習した大規模症例に対して, 毒性を効果的に検出する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:29:40 GMT)
Learning Alternative Ways of Performing a Task [10.8] ほとんどのタスクに対して、それらを実行するユニークな方法がないことはよく知られている。
なぜなら、スキルや専門家のノウハウといった要因が、タスクの解決方法に影響を及ぼす可能性があるからです。
複数のモデルを学習するための新しい帰納的アプローチを導入し、それぞれがタスクを実行するための代替戦略を表す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:54:58 GMT)
Task Agnostic Architecture for Algorithm Induction via Implicit Composition [10.6] 本研究の目的は,このような統一アーキテクチャの構築を探求することであり,その構築方法に関する理論的枠組みを提案することである。
最近のジェネレーティブAI、特にトランスフォーマーベースのモデルは、幅広い領域のアルゴリズムを構築することができるアーキテクチャとしての可能性を示している。
アルゴリズム合成におけるトランスフォーマーおよび他の手法の現在の機能と限界について検討する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:31:09 GMT)
Cohort-Individual Cooperative Learning for Multimodal Cancer Survival Analysis [10.6] がんの生存率分析を促進するためのCohort-individual Cooperative Learningフレームワークを提案する。
知識分解とコホート指導手法の協調により,頑健なマルチモーダルサバイバル分析モデルを構築した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 01:36:27 GMT)
Global Momentum Compression for Sparse Communication in Distributed Learning [10.5] 疎通信のための新しい手法として, Emphunderlineglobal emphunderlinemomentum emphunderlinecompression(GMC)を提案する。
我々の知る限りでは、分散学習におけるスパースコミュニケーションのグローバルな勢いを導入する最初の研究である。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:23:52 GMT)
Navigating Noise: A Study of How Noise Influences Generalisation and Calibration of Neural Networks [10.0] AugMixと弱い拡張はコンピュータビジョンにおけるクロスタスクの有効性を示す。
この研究は、一般化と校正の両方を同時に最適化する複雑さを強調している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:34:26 GMT)
CONSCENDI: A Contrastive and Scenario-Guided Distillation Approach to Guardrail Models for Virtual Assistants [9.9] 大きな言語モデル(LLM)をデプロイする際の大きな課題は、タスクに許容できる範囲内で運用することである。
本研究では,シナリオ拡張生成とコントラスト学習例という,2つの重要なコンポーネントによるトレーニングデータを総括的に生成するCONSCENDIを提案する。
CONSCENDIは複数の対話領域におけるベースラインよりも優れたガードレールモデルをもたらす。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 23:57:12 GMT)
SHIELD: A regularization technique for eXplainable Artificial Intelligence [9.7] 本稿では、説明可能な人工知能のための正規化手法であるShiELD(Selective Hidden Input Evaluation for Learning Dynamics)を紹介する。
従来の手法とは対照的に、ShielD正規化は目的関数にシームレスに統合され、モデル説明性を高め、性能も向上する。
ベンチマークデータセットの実験的検証は、人工知能モデルの説明可能性と全体的なパフォーマンスの改善におけるShiELDの有効性を裏付けるものだ。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:56:38 GMT)
Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective [9.6] 視覚質問応答問題におけるバイアスを解釈するための因果的枠組みを提案する。
因果グラフに触発され、12,000のVQAインスタンスからなる新しいMOREデータセットを導入する。
本稿では,MLLMの推論能力を高めるための2つの手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:18:51 GMT)
Steganographic Passport: An Owner and User Verifiable Credential for Deep Model IP Protection Without Retraining [9.6] ライセンス・ツー・ユースとオーナシップの検証のためにモデル機能を難なくするパスポートベースの現在の手法は、キャパシティと品質の制約に悩まされている。
本稿では,ステガノグラフィ・パスポートを提案する。ステガノグラフィ・パスポートは,ステガノグラフィ・ネットワークを用いて,ライセンス・ツー・ユースをオーナシップの検証から切り離す。
誘導されたユーザ側パスポートから所有者側パスポートが露出することを避けるために、不可逆かつ耐衝突性ハッシュ関数が使用される。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:44:02 GMT)
Weakly-Supervised 3D Scene Graph Generation via Visual-Linguistic Assisted Pseudo-labeling [9.4] 視覚言語支援擬似ラベルを用いた弱教師付き3次元シーングラフ生成法を提案する。
我々の3D-VLAPは、テキストと2D画像のセマンティクスを調整するために、現在の大規模視覚言語モデルの優れた能力を利用する。
エッジ自己アテンションに基づくグラフニューラルネットワークを設計し、3Dポイントクラウドシーンのシーングラフを生成する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:30:09 GMT)
Quantum Talagrand, KKL and Friedgut's theorems and the learnability of quantum Boolean functions [9.4] ブール関数の影響の分析から関連する3つの結果を量子不等式に拡張する。
この結果は、最近研究された超収縮率と勾配推定の併用によって導かれる。
我々は、等尺型不等式の非可換拡張、量子回路の複雑さの低い境界、および量子可観測体の学習可能性に関する結果の意味についてコメントする。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:45:46 GMT)
Task-conditioned adaptation of visual features in multi-task policy learning [9.3] 本研究では,事前学習したウェイトを微調整する必要のないタスク条件付きアダプタと,行動クローンを訓練した単一ポリシーを導入する。
我々は,CortexBenchベンチマークから多種多様なタスクに対する手法の評価を行い,既存の作業と比べ,一つのポリシーで対処できることを示した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:50:54 GMT)
FedSelect: Personalized Federated Learning with Customized Selection of Parameters for Fine-Tuning [9.2] FedSelect は Lottery Ticket 仮説に使用される反復的なサブネットワーク発見手順にインスパイアされた新しい PFL アルゴリズムである。
我々は、FedSelectがクライアントデータの不均一性設定に挑戦して、最近の最先端のPFLアルゴリズムより優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:36:21 GMT)
Prompting for Numerical Sequences: A Case Study on Market Comment Generation [9.2] 本研究では、トークンのシーケンスやHTML、Pythonスタイルのコードなどの構造化フォーマットなど、さまざまな入力表現について検討する。
実験では、市場コメント生成の課題に焦点を当てた。
予想とは対照的に、結果から、自然言語に類似したプロンプトと、より長いフォーマットがより良い結果をもたらすことが示されている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:10:11 GMT)
Empirical Analysis for Unsupervised Universal Dependency Parse Tree Aggregation [9.1] 依存関係解析はNLPにおいて必須のタスクであり、多くの下流タスクには依存性の品質が不可欠である。
様々なNLPタスクにおいて、アグリゲーション法は後処理のアグリゲーションに使われ、様々な品質の問題に対処することが示されている。
異なる非教師付き後処理アグリゲーション法を比較し、最も適した依存木構造アグリゲーション法を同定する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:53:38 GMT)
LPSNet: End-to-End Human Pose and Shape Estimation with Lensless Imaging [8.8] レンズレス計測から3次元人のポーズや形状を復元する最初のエンドツーエンドフレームワークを提案する。
具体的には、レンズレス計測を復号化するためのマルチスケールレンズレス特徴デコーダを設計する。
また,人間の手足端推定精度を向上させるために,両頭補助補助機構を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:43:15 GMT)
Evaluating GPT-4 with Vision on Detection of Radiological Findings on Chest Radiographs [8.8] 本研究は,100個の胸部X線写真から放射線学的所見を検出するために,視覚認識を備えた多モード大言語モデルであるGPT-4Vの応用について検討した。
GPT-4Vは、現在、胸部X線像の解釈において実際の診断には準備が整っていないことが示唆されている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:40:14 GMT)
Unsupervised Occupancy Learning from Sparse Point Cloud [8.7] Inlicit Neural Representationsは、複雑なデータモダリティをキャプチャする強力なフレームワークとして注目されている。
本稿では,ニューラルサイン付き距離関数の代わりに占有領域を推定する手法を提案する。
ベースラインに対する暗黙の形状推論を改善する能力と、合成データと実データを用いた最先端技術について強調する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:05:39 GMT)
Learning Sequence Attractors in Recurrent Networks with Hidden Neurons [8.6] 任意のパターン列を格納するには,ネットワークに隠されたニューロンを含める必要があることを示す。
隠れたニューロンを持つネットワーク内のシーケンスアトラクタを学習するための局所学習アルゴリズムを開発した。
ネットワークモデルは、合成および実世界のデータセット上で、シーケンスを堅牢に保存し、取得できることを実証する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:29:12 GMT)
The SaTML '24 CNN Interpretability Competition: New Innovations for Concept-Level Interpretability [8.6] SaTML 2024 CNN解釈可能性コンペティションは、ImageNetスケールで畳み込みニューラルネットワーク(CNN)を研究する新しい手法を募集した。
競争の目的は、人間の群衆労働者がCNNでトロイの木を識別できるようにすることであった。
本報告では,4つのコンペの実施方法と結果を紹介する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:56:28 GMT)
Attention is Naturally Sparse with Gaussian Distributed Input [8.6] 本研究では,Large Language Models (LLMs) における注意点の空間性に関する厳密な理論的解析を行った。
我々の主な貢献は、空間が注意機構にどのように現れるかに関する詳細な理論的考察を提供することであり、計算貯蓄とモデルの有効性の間の潜在的なトレードオフに関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:37:34 GMT)
Structure-reinforced Transformer for Dynamic Graph Representation Learning with Edge Temporal States [8.6] Recurrent Structure-Reinforced Graph Transformer (RSGT) という新しい動的グラフ表現学習フレームワークを導入する。
RSGTは最初、2つの連続するスナップショットの違いに基づいて、異なるエッジタイプとウェイトを利用して、エッジの時間的ステータスを明示的にモデル化した。
グラフトポロジ構造と進化力学の両方を符号化した時間ノード表現を捕捉する構造強化グラフ変換器を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:46:30 GMT)
On Linearizing Structured Data in Encoder-Decoder Language Models: Insights from Text-to-SQL [8.6] 本研究では,エンコーダ-デコーダ言語モデル,特にT5における構造化データの線形処理について検討する。
この結果から,スキーマリンクや構文予測など,人間設計プロセスの模倣が可能であることが判明した。
また、構造ノードエンコーディングのエゴ中心の性質を含む、モデルの内部メカニズムに関する洞察を明らかにした。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 01:16:20 GMT)
Deciphering Textual Authenticity: A Generalized Strategy through the Lens of Large Language Semantics for Detecting Human vs. Machine-Generated Text [8.3] プリトレーニング済みのT5エンコーダとLLM埋め込みサブクラスタリングを組み合わせた,機械生成テキスト検出システムT5LLMCipherを導入する。
提案手法は,機械生成テキストの平均F1スコアが19.6%増加し,非可視ジェネレータやドメインでF1スコアが平均上昇する,最先端の一般化能力を提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:20:10 GMT)
GeoT: Tensor Centric Library for Graph Neural Network via Efficient Segment Reduction on GPU [8.2] グラフニューラルネットワーク(GNN)に特化した最先端テンソル中心ライブラリGeoTを紹介する。
GeoTは、新しい設計原則を導入するだけでなく、利用可能なデザイン空間を拡大する革新的な並列アルゴリズムをデビューさせた。
GeoTは平均演算子のスピードアップが1.80倍、エンドツーエンドのスピードアップが1.68倍であることを示すことでかなり進歩した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:03:15 GMT)
Semi-supervised Active Learning for Video Action Detection [8.1] 我々はラベル付きデータとラベルなしデータの両方を利用する、新しい半教師付きアクティブラーニング手法を開発した。
提案手法は,UCF-24-101,JHMDB-21,Youtube-VOSの3種類のベンチマークデータセットに対して評価を行った。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:11:33 GMT)
RS3Mamba: Visual State Space Model for Remote Sensing Images Semantic Segmentation [7.9] 本稿では,この革新的な技術をリモートセンシングタスクに組み込むために,リモートセンシング画像セマンティックセマンティックセマンティフィケーションMamba (RS3Mamba) という新しいデュアルブランチネットワークを提案する。
RS3MambaはVSSブロックを使用して補助ブランチを構築し、畳み込みベースのメインブランチに追加のグローバル情報を提供する。
ISPRS VaihingenとLoveDA Urbanという2つの広く使われているデータセットの実験結果により、提案されたRS3Mambaの有効性と可能性を実証した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:59:28 GMT)
An Interpretable Client Decision Tree Aggregation process for Federated Learning [7.9] 本稿では,フェデレート学習シナリオを対象とした解釈可能なクライアント決定木集約プロセスを提案する。
このモデルは、決定ツリーの複数の決定パスの集約に基づいており、ID3やCARTなど、さまざまな決定ツリータイプで使用することができる。
4つのデータセットで実験を行い、分析により、モデルで構築された木が局所モデルを改善し、最先端のモデルより優れていることが示された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:53:56 GMT)
Self-supervised 6-DoF Robot Grasping by Demonstration via Augmented Reality Teleoperation System [7.8] 本稿では,拡張現実(AR)遠隔操作システムを用いて,自己監督型6-DoFグリップポーズ検出フレームワークを提案する。
実世界の実験において,提案システムは,3つの実演で未知の物体を把握できることを十分に把握し,学習する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:16:19 GMT)
Enhancing Human-Computer Interaction in Chest X-ray Analysis using Vision and Language Model with Eye Gaze Patterns [7.7] VLM(Vision-Language Models)は、視線データとテキストプロンプトを併用することで、放射線技師の注意を喚起する。
眼球データから生成した熱マップを医療画像にオーバーレイし、放射線技師の集中した領域をハイライトする。
その結果,視線情報の挿入は胸部X線解析の精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 00:09:05 GMT)
Enhancing Interpretability of Vertebrae Fracture Grading using Human-interpretable Prototypes [7.6] 本稿では,脊椎骨折(原型)の関連部分を見つけるための新しい解釈可能な設計手法であるProtoVerseを提案し,そのモデルの決定を人間に理解可能な方法で確実に説明する。
We have been experiment with the VerSe'19 dataset and outformed the existing prototype-based method。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:04:59 GMT)
Independently Keypoint Learning for Small Object Semantic Correspondence [7.4] キーポイントバウンディングボックス中心クロッピング法の提案
KBCNetはCSFAモジュールと効率的な4D畳み込みデコーダを備える。
提案手法はSPair-71kデータセットの7.5%の性能向上を示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:21:41 GMT)
Dispersive shock waves in a one-dimensional droplet environment [7.4] 量子液滴軸受環境に出現する異なる種類の分散衝撃波の制御可能な生成を実証する。
驚くべきことに、分散衝撃波は双曲から楕円の閾値を越えて持続する。
希薄化波、進行する分散衝撃波、(反)キンク、および液滴波列などの追加の波動パターンが出現する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:39:57 GMT)
On the Efficiency and Robustness of Vibration-based Foundation Models for IoT Sensing: A Case Study [7.1] 本稿では,(クラスの)IoTアプリケーションにおける実行時推論の堅牢性を改善するために,未ラベルのセンシングデータで事前学習した振動ベースファンデーションモデル(FM)の可能性を示す。
音響・地震探査を用いた車両分類を応用したケーススタディが提案されている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:04:06 GMT)
Convergence Analysis of Flow Matching in Latent Space with Transformers [7.1] 本稿では,ODEに基づく生成モデル,特にフローマッチングに関する理論的収束保証について述べる。
トレーニング済みのオートエンコーダネットワークを用いて、高次元の原入力を低次元の潜在空間にマッピングし、トランスフォーマーネットワークをトレーニングし、標準正規分布から目標潜在分布への変換速度場を予測する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:50:53 GMT)
uTeBC-NLP at SemEval-2024 Task 9: Can LLMs be Lateral Thinkers? [7.1] 本研究は,異なるプロンプト手法が,外的思考能力に固有の能力を明らかにするために,タスク上でのLLMの性能をいかに向上させるかを検討する。
我々は,GPT-4を用いて,グライダーとオプションの思考経路のデータセットを作成し,人間による品質評価を行った。
発見は、圧縮された情報伝達プロンプトが性能を大幅に向上させることを示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:31:59 GMT)
Entanglement entropy in type II$_1$ von Neumann algebra: examples in Double-Scaled SYK [7.0] 本稿では,Double-Scaled Sachdev-Ye-Kitaevモデルにおける固定長状態の絡み合いエントロピー$S_n$について検討する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:27:07 GMT)
Privacy-Aware Semantic Cache for Large Language Models [7.0] キャッシングは、繰り返しクエリの推論コストを削減するための自然なソリューションである。
本稿では,大規模言語モデルのためのユーザ中心セマンティックキャッシュであるMeanCacheを紹介する。
セマンティックに類似したクエリを特定して、キャッシュヒットやミスを判定する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:06:30 GMT)
Secret Keepers: The Impact of LLMs on Linguistic Markers of Personal Traits [6.9] 本研究では,Large Language Models (LLMs) が,人口動態や心理的特徴の言語マーカーに与える影響について検討する。
筆者らの個人的特徴に対する言語パターンの予測能力は, LLMの使用によってわずかに低下するが, 顕著な変化は稀である。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:29:12 GMT)
Multilevel Stochastic Optimization for Imputation in Massive Medical Data Records [6.7] 我々は最近開発された多段階計算最適化手法を医療記録の計算問題に適用した。
その結果, マルチレベル手法は現在の手法よりも大幅に優れ, 数値的に堅牢であることがわかった。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:09:12 GMT)
ANGOFA: Leveraging OFA Embedding Initialization and Synthetic Data for Angolan Language Model [6.7] 本稿では,多言語適応微調整(MAFT)アプローチを用いて,アンゴラ語に特化された4つの言語モデルを提案する。
本稿では、下流タスクにおけるMAFTモデルの性能向上における情報埋め込みと合成データの役割について調査する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:44:38 GMT)
Efficient Computation of the Quantum Rate-Distortion Function [6.3] 我々は、対称性の低減が、絡み合い支援量子速度歪み問題の一般的な例を著しく単純化することを示す。
提案手法は, 量子速度歪み関数を証明可能なサブ線形収束率で計算するミラー降下アルゴリズムの不正確な変種を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 01:42:00 GMT)
Accountable authentication with privacy protection: The Larch system for universal login [6.2] larchは、強力なセキュリティとプライバシ特性を備えた、説明可能な認証フレームワークである。
FIDO2、TOTP、パスワードベースのログインのためのlarchを実装している。
4コアのクライアントと8コアのログサーバを持つと、larchによる認証はFIDO2で150ms、TOTPで91ms、パスワードで74msとなる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 23:34:25 GMT)
Leveraging the Interplay Between Syntactic and Acoustic Cues for Optimizing Korean TTS Pause Formation [6.2] 本稿では,パジングパターンに関連する構文的手法と音響的手法の両方を包括的にモデル化する新しい枠組みを提案する。
注目に値することに、我々のフレームワークは、より拡張され複雑なドメイン外文(OOD)であっても、自然言語を一貫して生成する能力を持っている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:17:38 GMT)
ElasticLaneNet: An Efficient Geometry-Flexible Approach for Lane Detection [6.2] 本稿では,効率的な物理インフォームドエンドレーン検出フレームワークであるElasticLaneNetを紹介する。
本フレームワークは, 予測車線を, 地平に惹きつけられる柔軟形状のテクスタイトELM上でのゼロ輪郭移動とみなす。
その結果, 構造的に多様性のあるSDLaneに対して, 最先端の結果が得られた。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:54:15 GMT)
The largest EEG-based BCI reproducibility study for open science: the MOABB benchmark [6.1] 本研究は、オープン脳波データセットにおける脳-コンピュータインターフェース(BCI)の広範な解析を行う。
このようなベンチマークの必要性は、未公表のプロプライエタリなソリューションを生み出した産業の急速な進歩にある。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:18:50 GMT)
GPT-who: An Information Density-based Machine-Generated Text Detector [6.1] 精神言語学的に着想を得た最初のドメイン非依存型統計検出器であるGPT-whoを提案する。
この検出器は、UDDベースの特徴を用いて、LLM(Large Language Models)生成および人文生成の各テキストのユニークな統計的シグネチャをモデル化する。
過剰なテキストが認識できない場合でも、非常に洗練されたLCMによって生成されたテキストを区別できるGPT- who can distinguishing texts。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:59:10 GMT)
Integrating Explanations in Learning LTL Specifications from Demonstrations [6.1] 本稿では,LTL(Learar Temporal Logic)の学習を支援する形式として,Large Language Models (LLMs) の最近の進歩が人間の説明の翻訳に有効かどうかを検討する。
本稿では, LLMと最適化に基づく手法を組み合わせて, 人間の説明や実演を忠実に仕様に翻訳する手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:09:00 GMT)
Automated Transparency: A Legal and Empirical Analysis of the Digital Services Act Transparency Database [6.1] 2022年11月1日、デジタルサービス法(DSA)が採択された。
DSAは、オンラインプラットフォームがコンテンツモデレーションの決定を報告する必要性を強調している(理由のステートメント' - SoRs)。
SoRは現在、2023年9月に欧州委員会によってローンチされたDSA Transparency Databaseで利用可能である。
本研究の目的は,透明性データベースがDSAの透明性の約束を果たすのに役立つかどうかを理解することである。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:51:20 GMT)
MasonTigers at SemEval-2024 Task 9: Solving Puzzles with an Ensemble of Chain-of-Thoughts [5.9] 本稿では、SemEval-2024 Task 9にチームMasonTigersを提出する。
自然言語理解をテストするためのパズルのデータセットを提供する。
我々は,いくつかのプロンプト手法を用いて,この課題を解決するために,大規模言語モデル (LLM) を用いる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:40:07 GMT)
FreeZe: Training-free zero-shot 6D pose estimation with geometric and vision foundation models [5.8] 私たちは、特定のデータでトレーニングすることなく、同じタスクに取り組む方法を示します。
我々は、事前学習された幾何学的および視覚的基礎モデルの能力を利用する新しいソリューションFreeZeを提案する。
FreeZeは、合成6Dポーズ推定データで広く訓練されたライバルを含む、最先端のアプローチを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:58:13 GMT)
From Narratives to Numbers: Valid Inference Using Language Model Predictions from Verbal Autopsy Narratives [5.7] 我々は、最先端のNLP技術を用いて、自由形式のテキストから予測された結果を用いた有効推論法を開発した。
我々は、COD予測に一連のNLP技術を活用し、VAデータの実証分析を通して、輸送可能性問題に対処するためのアプローチの有効性を実証する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:53:37 GMT)
Leveraging Ensemble Diversity for Robust Self-Training in the Presence of Sample Selection Bias [5.7] 半教師付き学習において、自己学習はよく知られたアプローチである。モデルが自信を持ってラベル付きデータに擬似ラベルを反復的に割り当て、ラベル付き例として扱う。
ニューラルネットワークの場合、ソフトマックス予測確率はしばしば信頼度尺度として使用されるが、誤った予測であっても過度に信頼されていることが知られている。
本稿では,線形分類器のアンサンブルの予測多様性に基づいて,$mathcalT$-similarityと呼ばれる新しい信頼度尺度を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:32:09 GMT)
InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation [5.7] スタイルの概念は本質的に過小評価されており、色、材料、雰囲気、デザイン、構造といった様々な要素を含んでいる。
インバージョンベースの手法はスタイルの劣化を招きやすいため、細かな細部が失われることが多い。
アダプタベースのアプローチでは、スタイル強度とテキストの制御性のバランスをとるために、参照画像ごとに微妙な重み調整が必要となることが多い。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:34:09 GMT)
Vestibular schwannoma growth_prediction from longitudinal MRI by time conditioned neural fields [5.7] 本稿では,腫瘍進展予測のためのニューラルネットワークとリカレントニューラルネットワークを組み合わせたディープラーニング手法であるDeepGrowthを紹介する。
社内の経時的VSデータセットを用いた実験により,提案モデルにより性能が有意に向上した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:01:23 GMT)
Decision Transformer as a Foundation Model for Partially Observable Continuous Control [5.5] 決定変換器(DT)アーキテクチャは、過去の観測、行動、報酬に基づいて最適な行動を予測するために使用される。
DTは、全く新しいタスクに対して驚くべきゼロショットの一般化能力を示す。
これらの知見は、一般的な制御アプリケーションの基本制御系としてのDTの可能性を示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:17:34 GMT)
Efficient solution of the non-unitary time-dependent Schrodinger equation on a quantum computer with complex absorbing potential [5.4] グリッド上のリアルタイムSchr"odinger進化の境界に複雑な吸収ポテンシャルを加える可能性について検討する。
拡張量子アルゴリズムを用いて、実時間伝播と平行な仮想時間進化を取り扱う。
量子コンピュータで得られた結果は、古典的コンピュータで得られたものと同一である。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:13:30 GMT)
Mean Estimation with User-Level Privacy for Spatio-Temporal IoT Datasets [5.3] 実世界のデータセット上での低い推定誤差を保証するために,ユーザレベルの差分プライベートアルゴリズムを開発した。
インド都市のITMS(Intelligent Traffic Management System)データを用いて,本アルゴリズムを検証した。
ファストケースデータセットにおける擬似ユーザ生成に基づくアルゴリズムの性能を,ミニマックスアプローチを用いて評価する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:11:50 GMT)
Enhancing Diffusion-based Point Cloud Generation with Smoothness Constraint [5.1] 拡散モデルはポイントクラウド生成タスクで人気がある。
点雲生成のための拡散フレームワークに局所的滑らか性制約を組み込むことを提案する。
実験により、提案モデルが現実的な形状とスムーズな点雲を生成できることを示した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 01:55:15 GMT)
APC2Mesh: Bridging the gap from occluded building façades to full 3D models [5.1] 本稿では,ポイントコンプリートを3次元再構成パイプラインに統合するAPC2Meshを提案する。
具体的には、3次元メッシュ再構成のための線形化スキップアテンションに基づく変形ネットワークへの入力として、隠蔽された点から生成された完全点を利用する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 01:29:30 GMT)
The Surprising Effectiveness of Rankers Trained on Expanded Queries [4.9] 我々は,他のクエリのパフォーマンスを損なうことなく,難しいクエリや難しいクエリのランク付け性能を向上させる。
我々は,クエリ毎に推定されるクエリ性能スコアとともに,特殊ランク付け器と基本ランク付け器の関連性スコアを組み合わせる。
DL-Hardデータセットを用いた実験では,クエリ性能に基づくスコアリング手法が,パスランキングタスクにおいて最大25%の大幅な改善を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:12:22 GMT)
MeciFace: Mechanomyography and Inertial Fusion-based Glasses for Edge Real-Time Recognition of Facial and Eating Activities [4.8] リアルタイム・オン・ザ・エッジ(RTE)における表情と食事活動の監視を目的としたウェアラブル技術であるMeciFaceを紹介する。
MeciFaceは、健康的な食事行動やストレス管理を促進するために、低消費電力でプライバシーを意識し、高精度なツールを提供することを目指している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:56:01 GMT)
Dynamic Neural Control Flow Execution: An Agent-Based Deep Equilibrium Approach for Binary Vulnerability Detection [4.6] ソフトウェア脆弱性はサイバーセキュリティの課題だ。
DeepEXEはエージェントベースの暗黙のニューラルネットワークで、プログラムの実行パスを模倣する。
DeepEXEは正確かつ効率的な手法であり、最先端の脆弱性検出方法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 22:07:50 GMT)
Gegenbauer Graph Neural Networks for Time-varying Signal Reconstruction [4.6] 時間変化グラフ信号は、幅広い応用を伴う機械学習と信号処理において重要な問題である。
本稿では,下流タスクの精度を高めるために学習モジュールを組み込んだ新しい手法を提案する。
提案手法の有効性を評価するために,実データセットに関する広範な実験を行った。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:49:23 GMT)
Benchmarking Large Language Models for Persian: A Preliminary Study Focusing on ChatGPT [4.6] 本稿では,ペルシア語に対する大規模言語モデル(LLM)の有効性について検討する。
本稿では,ペルシャ語タスクにおけるLSMの総合的なベンチマーク研究について紹介する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:12:29 GMT)
Mixing Individual and Collective Behaviours to Predict Out-of-Routine Mobility [4.4] 本研究では,個人と集団の移動行動を動的に統合する手法を提案する。
より高度な深層学習手法を超越して、ルーチン外モビリティを予測する上で、優れた性能を示す。
個人的行動と集団的行動のギャップを埋めることによって、我々のアプローチは透明で正確な予測を提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:38:49 GMT)
Deep Learning-Based Weather-Related Power Outage Prediction with Socio-Economic and Power Infrastructure Data [4.4] 本稿では,企業サービス領域を含むセンサストラクタにおける時間ごとの停電確率予測のためのディープラーニングに基づくアプローチを提案する。
2つの異なる深層学習モデル、条件付きマルチ層パーセプトロン(MLP)と非条件付きモデルを開発し、停電確率を予測した。
以上の結果から,センサスレベルでの停電予測の精度を高める上で,社会経済的要因の重要性が示唆された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 23:38:31 GMT)
Online Control of Adaptive Large Neighborhood Search using Deep Reinforcement Learning [4.4] DR-ALNSと呼ばれる深層強化学習に基づくアプローチを導入し、演算子を選択し、パラメータを調整し、検索全体を通して受け入れ基準を制御する。
提案手法は,IJCAIコンペティションで提示されたオリエンテーリングウェイトと時間窓の問題に対して評価する。
その結果,本手法はバニラALNSよりも優れており,ALNSはベイジアン最適化と2つの最先端DRLアプローチに適合していることがわかった。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:58:01 GMT)
Teaching DevOps Security Education with Hands-on Labware: Automated Detection of Security Weakness in Python [4.3] 我々は、学習者が既知のセキュリティの弱点を識別できるハンズオン学習モジュールを導入した。
エンゲージメントとモチベーションのある学習環境を育むために、私たちのハンズオンアプローチには、プレラブ、ハンズオン、ポストラボセクションが含まれています。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:00:08 GMT)
BAdam: A Memory Efficient Full Parameter Training Method for Large Language Models [4.3] BAdamは、大きな言語モデルの完全なパラメータ微調整に対するメモリ効率のよいアプローチを提供する。
その結果, BAdam は LoRA や LOMO と比較して収束挙動が優れていることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:59:42 GMT)
Composite Bayesian Optimization In Function Spaces Using NEON -- Neural Epistemic Operator Networks [4.2] NEONは、単一のオペレータネットワークバックボーンを使用して不確実性のある予測を生成するアーキテクチャである。
NEONは、トレーニング可能なパラメータを桁違いに減らしながら、最先端のパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 22:42:37 GMT)
Estimating Treatment Effects using Multiple Surrogates: The Role of the Surrogate Score and the Surrogate Index [4.2] 治療の長期的な効果を見積もるのは、多くの分野において興味深いことである。
一つのアプローチは、しばしば統計代理と呼ばれる中間結果に対する治療効果を分析することである。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:55:08 GMT)
The Promises and Pitfalls of Using Language Models to Measure Instruction Quality in Education [4.0] 本稿では,自然言語処理(NLP)技術を活用して,複数のハイ推論教育実践を評価するための最初の研究について述べる。
ノイズや長い入力データ、人間の評価の高度に歪んだ分布など、NLPに基づく指導分析に固有の2つの課題に直面している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:15:29 GMT)
Encoding of lexical tone in self-supervised models of spoken language [3.7] 本稿では,音声言語モデル(SLM)のトーン符号化機能の解析を目的とした。
SLMは、非音節言語からのデータに基づいて訓練された場合でも、語彙のトーンをかなりの程度にエンコードすることを示す。
SLMは音色や子音の知覚研究において、母国人や非母国人と同様に振る舞う。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:59:20 GMT)
Price-Discrimination Game for Distributed Resource Management in Federated Learning [3.7] FedAvgのようなバニラ連合学習(FL)では、パラメータサーバ(PS)と複数の分散クライアントが典型的な買い手市場を形成する。
本稿では、異なるクライアントに対して同じサービス価格を提供するのではなく、異なるクライアントが提供するサービスの価格を区別することを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:13:44 GMT)
An Experiment with the Use of ChatGPT for LCSH Subject Assignment on Electronic Theses and Dissertations [3.6] この研究は、学術図書館でカタログ化を待っている項目のバックログに対して、LLM(Large Language Models)が戦略的に応答できることを示した。
LLMによるLCSHの妥当性, 徹底性, 特異性を検証し, 向上するためには, ヒトカタログは依然として不可欠である。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:22:05 GMT)
Catalytic Role Of Noise And Necessity Of Inductive Biases In The Emergence Of Compositional Communication [3.5] 本稿では,学習フレームワークとデータの両方に対する帰納的バイアスが,構成的コミュニケーションの発達に必要であることを示す。
エージェントがノイズチャネル上で通信するシグナリングゲームにおいて,構成性が自然に発生することを実証する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:39:55 GMT)
Towards Large Language Model driven Reference-less Translation Evaluation for English and Indian Languages [3.5] 本研究では,英語とインド語における翻訳の質を評価するために,人間の直接評価を模倣する実験を行った。
我々は,ゼロショット学習,インコンテキストのサンプル駆動学習,大規模言語モデルの微調整を行う翻訳評価タスクを構築し,100点中100点が完全翻訳であり,1点が不十分翻訳であることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:57:45 GMT)
Adversarial Attacks and Dimensionality in Text Classifiers [3.4] 機械学習アルゴリズムに対する敵対的な攻撃は、多くの現実世界のユースケースにおいて、AIの採用を妨げている。
本研究では,自然言語処理分野,特にテキスト分類タスクにおける逆例について検討する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:49:43 GMT)
Computational Capabilities and Compiler Development for Neutral Atom Quantum Processors: Connecting Tool Developers and Hardware Experts [3.4] Neutral Atom Quantum Computing (NAQC)は、有望なハードウェアプラットフォームとして登場した。
本研究では,NAQCプラットフォームに固有の機能スペクトルとそのコンパイルプロセスへの影響について検討する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:23:20 GMT)
Bias of AI-Generated Content: An Examination of News Produced by Large Language Models [3.4] 大規模言語モデル(LLM)は、AIGC(AI-Generated Content)として知られる、私たちの生活を変革し、彼らが生成するコンテンツを通じて機能する可能性を持っている。
本稿では,ChatGPT や LLaMA を含む 7 つの代表的な LLM が生成する AIGC のバイアスについて検討する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:47:54 GMT)
Exploring the Trade-off Between Model Performance and Explanation Plausibility of Text Classifiers Using Human Rationales [3.2] ホック後説明可能性法は、ますます複雑なNLPモデルを理解するための重要なツールである。
本稿では,人間の判断を説明するテキストアノテーションをテキスト分類モデルに組み込む手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 22:39:33 GMT)
Utilizing Computer Vision for Continuous Monitoring of Vaccine Side Effects in Experimental Mice [3.1] ワクチン投与後の副作用に対する実験マウスのモニタリングを自動化するためのコンピュータビジョン技術の応用について検討する。
予備的な結果は、コンピュータビジョンが微妙な変化を効果的に識別し、副作用を示唆していることを示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 23:59:59 GMT)
FAIR Enough: How Can We Develop and Assess a FAIR-Compliant Dataset for Large Language Models' Training? [3.0] 大規模言語モデルの急速な進化は、AI開発における倫理的考慮とデータの整合性の必要性を強調している。
FAIRの原則は倫理データのスチュワードシップに不可欠であるが、LLMトレーニングデータの文脈におけるそれらの特定の応用は未調査領域のままである。
本稿では,FAIR の原則を LLM 開発ライフサイクルに統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:34:10 GMT)
Generalization in the Face of Adaptivity: A Bayesian Perspective [3.0] 適応的に選択されたクエリによるデータサンプルの繰り返し使用は、急速に過度な適合につながる可能性がある。
単純なノイズアンバウンド付加アルゴリズムは、この問題を防ぐのに十分であることがわかった。
提案手法では, 過去のクエリに対する応答にデータサンプルに関する情報がどの程度エンコードされたか, ベイズ因子と新しいクエリの共分散から適応性の害が生じることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:39:10 GMT)
Auditing the Use of Language Models to Guide Hiring Decisions [2.9] アルゴリズムバイアスから保護するための規制努力は、大規模言語モデルで急速に進歩した緊急性を高めている。
現在の規制と科学文献は、これらの評価の実施方法に関するガイダンスをほとんど提供していない。
本稿では,監査アルゴリズムの1つのアプローチとして,対応実験を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 22:01:26 GMT)
One-photon-interference quantum secure direct communication [2.9] 測定デバイス非依存(MDI)QSDCプロトコルは、測定デバイスに関連するセキュリティの抜け穴を取り除くことができる。
本稿では,量子メモリ,理想的な単一光子源,あるいは絡み合った光源の必要性を超越した1光子干渉MDI QSDCプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:51:58 GMT)
Auxiliary task demands mask the capabilities of smaller language models [2.9] タスク要求が大きい評価手法は、要求の少ない評価よりも性能が低いことを示す。
この結果から,LM性能はインテリジェンスの直接的な表示として解釈するべきではないことが示唆された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:56:52 GMT)
MATHSENSEI: A Tool-Augmented Large Language Model for Mathematical Reasoning [2.9] 数学的推論のためのツール強化された大規模言語モデルであるMathSenseiを提案する。
ツールの補完的な利点として、知識検索(Bing Web Search)、プログラムジェネレータ+エグゼキュータ(Python)、記号方程式ソルバ(Wolfram-Alpha API)について検討する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:22:35 GMT)
Comuniqa : Exploring Large Language Models for improving speaking skills [2.8] 本稿では,Large Language Models (LLMs) の英語能力向上の可能性について検討する。
人工知能(AI)の最近の進歩は、限界を克服する有望なソリューションを提供する。
我々は,英語のスキル向上を目的とした,新しいLLMベースのシステムであるComuniqaを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:33:10 GMT)
Causality for Earth Science -- A Review on Time-series and Spatiotemporal Causality Methods [2.8] 本稿では、因果的発見と因果的推論の概要を述べ、根底にある因果的仮定を説明し、評価手法を列挙する。
本論文は,時系列および時間因果解析に導入された最先端の手法と,その強みと限界を取り入れたものである。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:33:23 GMT)
Mai Ho'omāuna i ka 'Ai: Language Models Improve Automatic Speech Recognition in Hawaiian [2.7] ハワイ語テキストの1.5万語で外部言語モデル(LM)を訓練する。
次に、LMを用いてWhisperを再スコアし、ハワイのラベル付きデータの手作業によるテストセット上でワードエラー率(WER)を計算する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:29:40 GMT)
Responsible Reporting for Frontier AI Development [2.7] フロンティアAIシステムからのリスクを緩和するには、それらのシステムに関する最新かつ信頼性の高い情報が必要である。
フロンティアシステムの開発と展開を行う組織は、そのような情報にかなりのアクセス権を持つ。
政府、産業、市民社会のアクターに安全クリティカルな情報を報告することで、これらの組織はフロンティア・システムによって引き起こされる新しい新興のリスクに対する可視性を向上させることができる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:18:45 GMT)
"Which LLM should I use?": Evaluating LLMs for tasks performed by Undergraduate Computer Science Students [2.6] 本研究では,大学生に共通する作業における大規模言語モデル(LLM)の有効性を評価する。
私たちの研究は、Google Bard、ChatGPT(3.5)、GitHub Copilot Chat、Microsoft Copilot Chatなど、公開されているLLMのいくつかを体系的に評価しています。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:19:44 GMT)
Bounds on the ground state energy of quantum $p$-spin Hamiltonians [2.6] 量子$p$局所スピングラスランダムハミルトニアンの基底状態エネルギーを推定する問題を考察する。
我々の主な結果は、積状態によって達成できる最大エネルギーは、明確に定義された限界を持つことを示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:00:05 GMT)
GPU-Accelerated RSF Level Set Evolution for Large-Scale Microvascular Segmentation [2.5] 本稿では,地域スケーラブルフィッティング(RSF)レベルセットモデルの改訂と実装を提案する。
これにより、単命令多重データ(SIMD)と単プログラム多重データ(SPMD)並列処理の両方を用いて3次元評価が可能となる。
我々は、最先端イメージング技術を用いて取得した複数のデータセットに対して、この3次元並列RSF手法を用いて、微小血管データを取得することを試みた。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:37:02 GMT)
Hallucination Benchmark in Medical Visual Question Answering [2.4] 我々は,質問応答セットと組み合わせた医療画像の幻覚ベンチマークを作成し,最先端モデルの総合的な評価を行った。
この研究は、現在のモデルの限界を詳細に分析し、様々なプロンプト戦略の有効性を明らかにする。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:42:32 GMT)
Designing a Photonic Physically Unclonable Function Having Resilience to Machine Learning Attacks [2.4] 機械学習(ML)攻撃の訓練に必要なデータセットを生成するための計算PUFモデルについて述べる。
モデル化されたPUFは均一な白色雑音に類似した分布を生成する。
予備的な解析は、PUFが生成する敵ネットワークに類似したレジリエンスを示すことを示唆している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:58:21 GMT)
DRL-Based RAT Selection in a Hybrid Vehicular Communication Network [2.3] 協調的なインテリジェントトランスポートシステムは、道路安全性を高めるために、V2X(Vager-to-Everything)の一連のアプリケーションに依存している。
新しいV2Xアプリケーションは、大量の共有データに依存し、高い信頼性、低エンドツーエンド(E2E)レイテンシ、高いスループットを必要とする。
本稿では、複数の無線アクセス技術(RAT)の性能を活用して、これらのアプリケーションのニーズを満たすインテリジェントでスケーラブルなハイブリッド車両通信アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:13:07 GMT)
BIRCO: A Benchmark of Information Retrieval Tasks with Complex Objectives [2.3] 複雑な目的を持つ情報検索タスクのベンチマーク(BIRCO)について述べる。
BIRCOは、多面的ユーザ目的のドキュメントを検索するIRシステムの能力を評価する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:11:02 GMT)
Methodology for Interpretable Reinforcement Learning for Optimizing Mechanical Ventilation [2.3] 本稿では,機械的換気制御のための決定木を用いた強化学習手法を提案する。
MIMIC-IIIデータを用いたリアル患者の集中治療室の滞在状況に関する数値実験により,決定木方針が行動クローニング方針より優れていることが示された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 23:07:24 GMT)
CV-Attention UNet: Attention-based UNet for 3D Cerebrovascular Segmentation of Enhanced TOF-MRA Images [2.2] 脳血管画像の正確な抽出にはCV-AttentionUNetと呼ばれる3次元脳血管注意UNet法を提案する。
低と高のセマンティクスを組み合わせるために,注意機構を適用した。
このアルゴリズムの新規性は、ラベル付きデータとラベルなしデータの両方でうまく機能する能力にあると考えています。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:57:10 GMT)
Super-resolution and super-sensitivity of quantum LiDAR with multi-photonic state and binary outcome photon counting measurement [2.2] 我々は, 多光子状態 (MPS) と4つのコヒーレント状態の重畳を入力状態とし, 2次出力パリティ光子計数測定を行っている。
我々は、コヒーレント状態およびコヒーレント重ね合わせ状態に基づく量子LiDARと比較して、分解能と位相感度が向上することを発見した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:27:55 GMT)
Can My Microservice Tolerate an Unreliable Database? Resilience Testing with Fault Injection and Visualization [2.1] データベースクライアントのフォールトインジェクションの拡張を開発し、Filibusterに統合しました。
我々のツールは、データベースの破壊を体系的にシミュレートし、アプリケーションレジリエンスの包括的なテストと評価を可能にする。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:28:33 GMT)
New methods for drug synergy prediction [2.1] 2021年以降、30以上のオリジナルの機械学習手法が出版された。
我々はこれらの論文を、コア技術、データソース、入力データタイプ、およびそれらの手法で使用されるシナジースコアを強調することにより、統一されたレンズの下に置くことを目指している。
我々の発見によれば、最も優れた方法は、既知の薬物や細胞株を含む相乗的予測シナリオを正確に解決する一方で、新しい薬物や細胞株を含むシナリオは、依然として正確な予測レベルには達していない。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:44:03 GMT)
Quantum-enhanced super-sensitivity of Mach-Zehnder interferometer using squeezed Kerr state [2.1] 我々は,MZI(Mach-Zehnder Interferometer)の位相超感度を,圧縮したKerrとコヒーレントな状態を入力として検討した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:37:10 GMT)
Skeleton Recall Loss for Connectivity Conserving and Resource Efficient Segmentation of Thin Tubular Structures [2.1] 容器、神経、道路、コンクリートクラックなどの細い管状構造を正確に分断することは、コンピュータビジョンにおいて重要な課題である。
DiceやCross-Entropyのような標準的なディープラーニングベースのセグメンテーション損失関数は、しばしば構造的な接続性やトポロジーを犠牲にしてオーバーラップに焦点を当てる。
我々は,GPUベースの計算を低コストなCPU操作で回避し,これらの課題を効果的に解決する新しいSkeleton Recall Lossを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:42:19 GMT)
Probing electron quadrupling order through ultrasound [2.0] 最近の実験では、Ba$_1-x$K$_x$Fe$$As$$における電子四重対凝縮体(英語版)という新しい物質状態の形成が指摘されている。
状態は自然に時間反転対称性を破り、2つの臨界点の間に挟まれ、超伝導状態と通常の金属状態から分離される。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:07:39 GMT)
Anyonic quantum multipartite maskers in the Kitaev model [2.0] 我々は、北エフモデルにおいて、アベリアンとイジングのラテン二乗構成を%とし、任意の正則空間におけるマスク可能な空間構成について研究する。
また,キタエフ・イジング・エニオン・モデルにおいて,量子情報マスキングをテレポーテーション方式で実現している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:37:07 GMT)
Enhancement in phase sensitivity of SU(1,1) interferometer with Kerr state seeding [1.9] 本研究では,SU(1,1)干渉計のKerr状態シードによる位相感度について,単一強度およびホモダイン検出方式で検討した。
我々は、Kerr状態が量子情報およびセンシング技術分野における代替の非古典的状態として機能することを期待している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:18:07 GMT)
AI-augmented Automation for Real Driving Prediction: an Industrial Use Case [1.9] 本稿では,機械学習とモデルベース工学に基づくAI拡張ソリューションを開発する実践経験について報告する。
特に、実運転条件で収集された履歴データを利用して、高忠実性駆動シミュレータを合成する。
この実践的経験に基づいて,実運転行動に基づく予測を支援する概念的枠組みも提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:19:47 GMT)
Linear Anchored Gaussian Mixture Model for Location and Width Computation of Objects in Thick Line Shape [1.7] 統計的分布の有限混合モデルとして、画像グレーレベルの3次元表現を考慮し、画像中の線形構造を検出することを目的とする。
混合モデルパラメータ推定には期待最大化アルゴリズムを用いる。
実世界の画像と合成画像のぼかしと付加音による劣化実験は,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:05:00 GMT)
Adversarial Evasion Attacks Practicality in Networks: Testing the Impact of Dynamic Learning [1.7] 敵攻撃は、MLモデルを騙して欠陥予測を生成することを目的としている。
敵攻撃はMLベースのNIDSを妥協する。
本実験は, 対人訓練を伴わない継続的再訓練は, 対人攻撃の有効性を低下させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:55:46 GMT)
Conditional not displacement: fast multi-oscillator control with a single qubit [1.6] ボソニック符号化は量子情報処理のアプローチであり、ハードウェアオーバーヘッドの低減を約束する。
複数のモードに高速で効率的なユニバーサル制御を適用することは、未解決の問題である。
本稿では,ゲートの絡み合い時間を削減するために,条件付き操作の概念を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:30:36 GMT)
Testing the Effect of Code Documentation on Large Language Model Code Understanding [1.6] 大きな言語モデル(LLM)は、コード生成と理解に関して印象的な能力を示している。
LLMに“誤った”ドキュメンテーションを提供することで、コードの理解が著しく阻害されることが示されています。
不完全あるいは欠落したドキュメントは、LLMがコードを理解する能力に大きく影響しないことを示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 23:33:56 GMT)
FlightScope: A Deep Comprehensive Assessment of Aircraft Detection Algorithms in Satellite Imagery [1.6] 本稿では,衛星画像中の航空機を識別するタスク用にカスタマイズされた,高度な物体検出アルゴリズム群を批判的に評価し,比較する。
この研究は、YOLOバージョン5と8、より高速なRCNN、CenterNet、RetinaNet、RTMDet、DETRを含む一連の方法論を含む。
YOLOv5は空中物体検出のための堅牢なソリューションとして登場し、平均的精度、リコール、ユニオンのスコアに対するインターセクションによってその重要性を裏付けている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:24:27 GMT)
Adaptive Affinity-Based Generalization For MRI Imaging Segmentation Across Resource-Limited Settings [1.6] 本稿では,適応親和性に基づく蒸留とカーネルベースの蒸留をシームレスに組み合わせた,新しい関係に基づく知識フレームワークを提案する。
革新的アプローチを検証するために,我々は公開されている複数ソースのMRIデータについて実験を行った。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:35:51 GMT)
Mobile user experience from the lens of project-based learning [1.5] 本研究は,8年間に渡り学習した授業について考察し,学生プロジェクトの結果と,他の大学や国から近づいた最近公表された傾向とを比較した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:20:07 GMT)
Towards detecting unanticipated bias in Large Language Models [1.5] LLM(Large Language Models)は、従来の機械学習システムと同様の公平性問題を示す。
本研究は、トレーニングデータにおけるバイアスの分析と定量化と、それらのモデルの決定に対する影響に焦点を当てる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:25:20 GMT)
Electric Vehicle Routing Problem for Emergency Power Supply: Towards Telecom Base Station Relief [1.5] 電気自動車(EV)が基地局に電力を直接供給するソリューションについて検討する。
目標は、すべてのEVの総走行距離と、ダウンした基地局の数の両方を最小化するEVルートを見つけることである。
本稿ではルールベースの車両セレクタと強化学習(RL)ベースのノードセレクタを組み合わせた問題解決手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:27:07 GMT)
Cultural influence on autonomous vehicles acceptance [1.4] 我々は、よく知られたホフスティード文化モデルを用いて、自動運転車の受容と国民文化の関係を分析する。
これまでの研究では、自動運転車に対する認識とそれらに対する態度は、応答者の年齢、教育水準、背景など、様々な属性に依存することが示されている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:10:24 GMT)
CodeMind: A Framework to Challenge Large Language Models for Code Reasoning [1.4] 大規模言語モデル(LLM)のコード推論能力を評価するために設計されたフレームワークであるCodeMindを紹介する。
CodeMindは、Independent Execution Reasoning (IER)、Dependent Execution Reasoning (DER)、Specification Reasoning (SR)の3つのコード推論タスクをサポートしている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:23:48 GMT)
GreedLlama: Performance of Financial Value-Aligned Large Language Models in Moral Reasoning [1.4] 本稿では,大規模言語モデルと金融最適化の整合性に関する倫理的意味を考察する。
モラル推論タスクにおけるGreedLlamaのパフォーマンスをベースとなるLlama2モデルと比較することにより、この結果が関連する傾向を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:16:37 GMT)
Law and the Emerging Political Economy of Algorithmic Audits [1.4] デジタルサービス法(DSA)とオンライン安全法(OSA)は、テクノロジー企業や(伝統的に)監査人がアルゴリズム監査の実践を開発する枠組みを確立している。
本稿では,DSAとOSAにおける監査規定を,アルゴリズム監査の新興産業からの観測を踏まえて体系的にレビューする。
我々は、アルゴリズム監査の野心的な研究アイデアと技術プロジェクトは、従来の監査員の標準化によって崩壊する可能性があることを警告する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:45:30 GMT)
An Optimization Framework to Personalize Passive Cardiac Mechanics [1.3] 本研究は、心臓組織の受動力学的特性を推定する逆有限要素解析(iFEA)フレームワークを提案する。
受動的機械的挙動を特徴づけることに焦点をあて、このフレームワークは構造に基づく異方性超弾性モデルを採用している。
本フレームワークは,心相分解CT画像から得られた胆道および左房の心筋モデルを用いて検討した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:23:17 GMT)
WebSPL: A Software Product Line for Web Applications [1.3] 本稿では,Webアプリケーション向けの製品ラインであるWebSPLについて述べる。
提案する WebSPL は,従来のアプローチに基づく Web アプリケーションと比較して評価した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:04:54 GMT)
A Theoretical and Empirical Study on the Convergence of Adam with an "Exact" Constant Step Size in Non-Convex Settings [1.2] ニューラルネットワークトレーニングでは、RMSとAdamは依然として広く好まれているアルゴリズムである。
理論的には、アダムのステップサイズに対する定数収束を解析する。
いくつかの過去の蓄積にもかかわらず、Adamにおける収束の鍵となる要因は、非ステップのサイズであることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:36:16 GMT)
An active learning method for solving competitive multi-agent decision-making and control problems [1.2] 競合エージェントの集団に対する定常行動プロファイルを特定するための,新しいアクティブラーニング手法を提案する。
提案手法は,典型的なマルチエージェント制御と意思決定問題に適用可能であることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:44:34 GMT)
Hamiltonian Simulation in the Interaction Picture Using the Magnus Expansion [1.2] 幾何学的局所なハミルトニアン$A$の力学を小さな幾何学的局所な$alpha B$の下でシミュレーションするアルゴリズムを提案する。
ある摂動状態において、アルゴリズムは最適なスケーリングを達成し、最先端のアルゴリズムより優れている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:00:04 GMT)
AI and personalized learning: bridging the gap with modern educational goals [1.2] OECD Learning Compass 2030の目標を考慮したAI駆動型パーソナライズドラーニングソリューションの特性について検討する。
現代のPL技術が現代教育に欠かせない要素を取り入れた地域を特定する。
本稿では,人工知能と教師が共用する学習手法を融合したハイブリッドモデルを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:07:00 GMT)
Cross-Architecture Transfer Learning for Linear-Cost Inference Transformers [1.1] 本稿では,トランスフォーマ言語モデルの効率を向上させるために,クロスアーキテクチャトランスファー学習(XATL)を提案する。
Methodabbrはトレーニング時間を最大2.5倍に削減し、同じ計算予算内でLMベンチマークで最大2.6%より強力なモデルで最小限に収束する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:27:36 GMT)
Robustness Assessment of a Runway Object Classifier for Safe Aircraft Taxiing [1.1] ディープニューラルネットワーク(DNN)は多くの計算問題の顕著な解決策になりつつある。
本稿では,航空機のタクシー走行時に使用する画像分類器DNNのロバスト性を実証する。
我々は、このDNNの頑健さを、ノイズ、明るさ、コントラストという3つの一般的なイメージ摂動タイプに評価するために、フォーマルな手法を用いています。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:28:43 GMT)
CamemBERT-bio: Leveraging Continual Pre-training for Cost-Effective Models on French Biomedical Data [1.1] BERTライクなモデルによるトランスファーラーニングは、特に名前付きエンティティ認識において、フランス語に大きな進歩をもたらした。
我々は,フランスの生物医学モデルであるCamemBERT-bioを紹介した。
連続的な事前トレーニングを通じて、CamemBERT-bioは、様々な生物医学的名前付きエンティティ認識タスクで平均2.54ポイントのF1スコアを達成している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:48:57 GMT)
"You tell me": A Dataset of GPT-4-Based Behaviour Change Support Conversations [1.1] 我々は2つのGPT-4ベースの会話エージェントを用いて、行動変化に関連するテキストベースのユーザインタラクションを含むデータセットを共有する。
このデータセットには、会話データ、ユーザ言語分析、知覚測定、LLM生成ターンに対するユーザフィードバックが含まれる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:02:52 GMT)
LeanVec: Searching vectors faster by making them fit [1.1] 本稿では,高次元ベクトル上での類似性探索を高速化するために,線形次元減少とベクトル量子化を組み合わせたフレームワークLeanVecを提案する。
LeanVecは、検索のスループットを最大3.7倍改善し、インデックスビルド時間を最大4.9倍高速化する、最先端の結果を生成する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:18:24 GMT)
Efficient Quantum Circuits for Non-Unitary and Unitary Diagonal Operators with Space-Time-Accuracy trade-offs [1.1] ユニタリおよび非ユニタリ対角作用素は量子アルゴリズムの基本的な構成要素である。
本稿では,一元対角演算子と非単元対角演算子を効率よく調整可能な量子回路で実装する一般手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:42:25 GMT)
A Transformer-based Diffusion Probabilistic Model for Heart Rate and Blood Pressure Forecasting in Intensive Care Unit [1.0] 本研究は、ICUにおける心拍数(HR)、収縮血圧(SBP)、拡張型血圧(DBP)の予測のための新しい深層学習手法を提案する。
われわれは、MIMIC-IIIデータベースから24,886ドル(約2万2000円)のICUを抽出し、そのモデルをトレーニングし、テストした。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:24:18 GMT)
Beyond Quantum Shannon: Circuit Construction for General n-Qubit Gates Based on Block ZXZ-Decomposition [1.0] 本稿では,新しい量子ブロックZXZ分解法を提案する。
これは量子シャノン分解(QSD)[27]よりも最適な量子回路をもたらす。
本手法は1量子ゲートと一様制御の回転Zゲートのみを用いるため,他の種類のマルチキュービットゲートにも容易に適用できる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:10:27 GMT)
AQuA -- Combining Experts' and Non-Experts' Views To Assess Deliberation Quality in Online Discussions Using LLMs [1.0] AQuAは、議論投稿ごとに複数の指標から統一された熟考品質スコアを算出する付加的なスコアである。
我々は,20の熟考指標に対する適応モデルを開発し,専門家のアノテーションと認識された熟考度との相関係数を非専門家によって計算し,各指標を1つの熟考スコアに重み付けする。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:07:02 GMT)
Mixed-encoding one-photon-interference quantum secure direct communication [1.0] 1光子干渉QSDC (OPI-QSDC) は伝送距離を向上し、安全なポイントツーポイント情報伝送を保証する技術である。
本稿では,位相ロック技術の必要性を解消する,混合符号化ワンフォトン干渉QSDCプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:56:06 GMT)
Unsupervised Learning of Effective Actions in Robotics [0.9] ロボット工学における現在の最先端のアクション表現は、ロボットのアクションに対する適切な効果駆動学習を欠いている。
連続運動空間の離散化と「アクションプロトタイプ」生成のための教師なしアルゴリズムを提案する。
シミュレーションされた階段登上補強学習課題について,本手法の評価を行った。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:28:52 GMT)
Creating a Trajectory for Code Writing: Algorithmic Reasoning Tasks [0.9] 本稿では,楽器とその検証に用いる機械学習モデルについて述べる。
我々は,学期最後の週に導入プログラミングコースで収集したデータを用いてきた。
先行研究は、ARTタイプの楽器を特定の機械学習モデルと組み合わせて効果的な学習軌道として機能させることができることを示唆している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:07:01 GMT)
MODNO: Multi Operator Learning With Distributed Neural Operators [0.9] 演算子学習の研究には、ニューラルネットワークを近似演算子に利用することが含まれる。
近年の進歩は、数百万から数十億のトレーニング可能なパラメータを備えた基礎モデルを用いて、複数の演算子の近似を急速に拡張している。
本稿では,パラメータが大幅に少ない1つのニューラル演算子で,マルチオペレータ学習の課題に対処することを目的とした,分散トレーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:49:41 GMT)
Solving a Real-World Optimization Problem Using Proximal Policy Optimization with Curriculum Learning and Reward Engineering [0.9] 本稿では,カリキュラム学習(CL)の原則と巧妙な報酬工学によって訓練されたPPOエージェントを提案する。
我々の研究は、運用上の安全性、ボリューム最適化、リソース使用量の最小化という競合する目標を効果的にバランスさせることの課題に対処する。
提案手法は, プラントの処理効率の向上に加えて, 推定時間の安全性を著しく向上し, ほぼゼロに近い安全性違反を達成できることを実証した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:53:42 GMT)
Towards a Fully Interpretable and More Scalable RSA Model for Metaphor Understanding [0.8] Rational Speech Act (RSA) モデルは、計算用語で実用的推論をモデル化するための柔軟なフレームワークを提供する。
本稿では、明示的な公式を提供することで制限に対処するメタファー理解のための新しいRSAフレームワークを提案する。
このモデルは、従来の$textitJohn-is-a-shark$型に限らず、24のメタファでテストされた。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:09:33 GMT)
MeshBrush: Painting the Anatomical Mesh with Neural Stylization for Endoscopy [0.8] スタイルトランスファーは、医療内視鏡におけるシミュレートとリアルのギャップを埋めるための有望なアプローチである。
手術前のスキャンでリアルな内視鏡映像をレンダリングすると、リアルなシミュレーションや、地上の真相カメラのポーズ、深度マップが生成される。
本稿では、時間的に一貫した動画を異なるレンダリングで合成するニューラルネットワークスタイリング手法であるMeshBrushを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:40:48 GMT)
The Artificial Intelligence Ontology: LLM-assisted construction of AI concept hierarchies [0.8] 人工知能オントロジー(AIO)は、人工知能の概念、方法論、それらの相互関係の体系化である。
AIOは、AI技術の技術的側面と倫理的側面の両方を含む包括的なフレームワークを提供することによって、急速に進化するAIの展望に対処することを目指している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:08:15 GMT)
Breaking the Silence Detecting and Mitigating Gendered Abuse in Hindi, Tamil, and Indian English Online Spaces [0.7] チームCNLP-NITS-PPは、CNNとBiLSTMネットワークを組み合わせたアンサンブルアプローチを開発した。
CNNは、組み込み入力テキストに適用される畳み込みフィルタを通じて、乱用言語を表す局所的な特徴をキャプチャする。
BiLSTMは、単語とフレーズ間の依存関係について、このシーケンスを解析する。
評価スコアはf1尺度、特に英語0.84に対して高い性能を示した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:14:01 GMT)
Assessing ML Classification Algorithms and NLP Techniques for Depression Detection: An Experimental Case Study [0.7] うつ病は世界中で何百万人もの人々に影響を与えており、最も一般的な精神疾患の1つとなっている。
近年の研究では、機械学習(ML)と自然言語処理(NLP)のツールや技術がうつ病の診断に広く用いられていることが証明されている。
しかし, 外傷後ストレス障害 (PTSD) などの他の症状が存在するうつ病検出アプローチの評価には, 依然としていくつかの課題がある。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:45:40 GMT)
Unsupervised, Bottom-up Category Discovery for Symbol Grounding with a Curious Robot [0.6] 本研究では,好奇心の近似モデルを備えたロボットを,物理的世界に根ざした教師なしカテゴリーのボトムアップ構築に特化して活用する。
つまり、トップダウンのシンボルから始めるのではなく、このロボットは自律的に探査スペースを、ラベル付けされていない一連のカテゴリーに分割する。
実験の結果,ロボットは行動と視覚的に観察するものに基づいてカテゴリを学習し,それらのカテゴリを象徴的に理解することができることがわかった。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 22:13:04 GMT)
Attributions toward Artificial Agents in a modified Moral Turing Test [0.6] 我々は、一般的な高度なAI言語モデルであるGPT-4と実際の人間の道徳的評価を区別するよう、人々に求めている。
299人の米国成人の代表的サンプルは、AIの道徳的推論を、ほぼすべての次元において、人間よりも品質が優れていると評価した。
言語モデルの出現は、人間よりも質が高いと認識される道徳的反応を生み出すことができるようになり、人々がAIから潜在的に有害な道徳的ガイダンスを受け入れる可能性があるという懸念が高まる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:00:47 GMT)
Online Optimization for Randomized Network Resource Allocation with Long-Term Constraints [0.6] 簡単な通信網における最適オンラインリソース予約問題について検討する。
そこで我々は,オンラインサドルポイントアルゴリズムを提案し,関連するK-ベンチマークの後悔に対する上限を提示する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:45:07 GMT)
VIAssist: Adapting Multi-modal Large Language Models for Users with Visual Impairments [0.6] 全世界で220億人が視覚障害に罹患している。
MLLMの視覚的理解と推論の優れた能力を持つVI人を助けることが望ましい。
本稿では,視覚的な質問応答を提供するために,MLLMをVI個人に活用する方法について検討する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:53:27 GMT)
VASARI-auto: equitable, efficient, and economical featurisation of glioma MRI [0.5] VASARI MRI機能セットはグリオーマ画像記述の標準化のために設計された定量的システムである。
VASARI-autoを開発した。これはオープンソースの病変マスクと利用可能な腫瘍分割モデルの両方に適用できる自動ラベルソフトウェアである。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:33:07 GMT)
Investigation of Purcell enhancement of quantum dots emitting in the telecom O-band with an open fiber-cavity [0.5] 光マイクロキャビティに統合された単一光子エミッタは、量子通信アプリケーションにおいて重要な要素である。
ここでは、オープンファイバキャビティに統合された通信Oバンドに放出される半導体量子ドット(QD)について、徹底的に検討する。
この設計は、内在的なファイバーカップリングを備えた全空間次元で調整可能な光学マイクロキャビティを提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:19:28 GMT)
Direct Experimental Constraints on the Spatial Extent of a Neutrino Wavepacket [0.4] ニュートリノは 自然の素粒子として 理解されていない
弱い核崩壊では、ニュートリノの波束である$sigma_nu,x$は、生産時の親の空間波動関数と関連している。
我々は、新しい実験的な概念を通じて、この量の最初の直接的な限界を提示する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 23:02:17 GMT)
Modelling the Impact of Quantum Circuit Imperfections on Networks and Computer Applications [0.3] ポスト量子および量子暗号スキームは、7Gネットワークのための実現可能な量子コンピュータアプリケーションである。
これらのアルゴリズムは、Shorアルゴリズムのような量子コンピュータ上で動作する量子検索アルゴリズムの進歩によって妥協された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 14:29:55 GMT)
Techniques for Measuring the Inferential Strength of Forgetting Policies [0.3] 本稿では,モデルカウントと確率論からの直感に基づく推論強度の変化を測定するための損失関数を定義する。
忘れることに重点を置いているが、結果はずっと一般的であり、他の分野にも広く適用されるべきである。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:50:43 GMT)
Similar Data Points Identification with LLM: A Human-in-the-loop Strategy Using Summarization and Hidden State Insights [0.3] 本研究では,非自由テキスト領域にまたがる類似データ点を簡易かつ効果的に同定する手法を提案する。
我々の2段階のアプローチは、データポイントの要約と隠れ状態抽出である。
複数のデータセット上で類似したデータポイントを同定する上で,本手法の有効性を示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:17:28 GMT)
Global, robust and comparable digital carbon assets [0.3] 本稿では,カーボンオフセットの主張を透過的に検証できる新しいデジタルカーボンアセット(PACTステーブルコイン)を提案する。
我々は、低コストなトランザクションを容易にするように設計されたTezosブロックチェーン上で、PACTの炭素安定係数を実装し、評価する。
我々の研究は、高完全性な炭素クレジット取引のための透明でスケーラブルで効率的なフレームワークを提供することで、自発的な炭素市場へのスケールと信頼をもたらします。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:54:21 GMT)
Toward Safe Evolution of Artificial Intelligence (AI) based Conversational Agents to Support Adolescent Mental and Sexual Health Knowledge Discovery [0.2] 青少年の精神・性的健康知識発見を支援するための会話エージェント(CA)の現状と機会について論じる。
我々は、青少年のためのAIベースのCAの安全な進化のためにガードレールを設定する方法についての談話を求めている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:18:25 GMT)
Large Language Models for Expansion of Spoken Language Understanding Systems to New Languages [0.2] Spoken Language Understanding(SLU)モデルは、Alexa、Bixby、Google Assistantなどの音声アシスタント(VA)のコアコンポーネントである。
本稿では,Large Language Models (LLM) を利用して,SLUシステムを新しい言語に拡張するパイプラインを提案する。
当社のアプローチは,mBERTモデルを用いたクラウドシナリオにおいて,主要なマルチ言語SLUデータセットであるMultiATIS++ベンチマークを改善した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:13:26 GMT)
A simple lower bound for the complexity of estimating partition functions on a quantum computer [0.2] 分割関数 $mathsfZ(beta)=sum_xinchi e-beta H(x)$ をハミルトニアン$H(x)$ で特徴づけられるギブス分布に対して推定する複雑性について検討する。
我々は、ギブス状態のコヒーレントな符号化を通して反射に依存することにより、この問題を解く量子アルゴリズムの単純で自然な下界を提供する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:38:49 GMT)
Dephasing in Fluxonium Qubits from Coherent Quantum Phase Slips [0.2] JJアレイスーパーインダクタからなる超伝導量子ビットでは、アレイ内の位相スリップがデコヒーレンスを引き起こす。
我々は、コヒーレント量子位相スリップ(CQPS)がクォービット周波数を摂動的に変化させることを示し、従って配列列島の電荷ノイズが劣化を引き起こすことを示した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:17:00 GMT)
tsGT: Stochastic Time Series Modeling With Transformer [0.1] 本稿では,汎用トランスアーキテクチャ上に構築された時系列モデルであるtsGTを紹介する。
tsGT は MAD と RMSE の最先端モデルより優れており、QL と CRPS のピアよりも 4 つの一般的なデータセットで優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:17:21 GMT)
Error mitigation, optimization, and extrapolation on a trapped ion testbed [0.1] ゼロノイズ補間(ZNE)と呼ばれる誤差軽減の形式は、必要なキュービット数を増やすことなく、これらのエラーに対するアルゴリズムの感度を低下させることができる。
本稿では,この誤差軽減手法を変分量子固有解法(VQE)アルゴリズムに統合するための様々な手法について検討する。
本手法の有効性は, デバイスアーキテクチャの適切な実装を選択することによる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:54:12 GMT)
Human Mobility in the Metaverse [0.0] 通勤コストの欠如にもかかわらず、新しい場所を探索する個人は時間が経つにつれて減少することがわかった。
また, 土地価格と来訪の相関関係の欠如が, 物理的世界を特徴付けるパターンから逸脱していることも見いだした。
我々のメタモビリティネットワークの特徴を予測する能力は、人間の移動を規定する法則が人間の力学の基本パターンに根ざしていることを示唆している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:26:40 GMT)
scenario.center: Methods from Real-world Data to a Scenario Database [0.0] 本稿ではシナリオデータ処理と管理を行うシナリオデータベースシナリオ.centerについて述べる。
品質要件が定義された共通入力形式が定義される。
評価のために、この方法論は最先端のシナリオデータベースと比較される。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:29:44 GMT)
Vocabulary Attack to Hijack Large Language Model Applications [0.0] 大規模言語モデル(LLM)は、ますます多くのアプリケーションを駆動している。
彼らはモデルに機密情報、特定の偽情報、または攻撃的な行動を明らかにすることを望んでいます。
モデル語彙から単語を挿入することで,これらのシステム外へのアプローチを提案する。
対象モデルとは異なるモデルを用いて攻撃を行うことが可能であることを実証した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:54:07 GMT)
Transfer learning applications for anomaly detection in wind turbines [0.0] 風力タービンの異常検出は通常、異常を早期に検出するために通常の挙動モデルを使用する。
本研究では, 自動エンコーダによる異常検出において, 橋渡し学習をいかに応用できるかを検討する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:48:45 GMT)
Towards a Probabilistic Foundation of Relativistic Quantum Theory: The One-Body Born Rule in Curved Spacetime [0.0] この研究は、曲がった時空に対する粒子位置の確率を決定する量子力学ボルン則の一般化に基づいている。
この研究の主要な動機は、量子場理論の内部数学的問題を克服することである。
この研究の数学物理学文学への主な貢献は、ラグランジアン像の発展である。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:17:09 GMT)
The Societal Implications of Blockchain Proliferation [0.0] Bitcoinとその分散型台帳技術は、世界中の消費者にとって大きな影響を与えている。
破壊的なインフラストラクチャを信頼ベースのソリューションに置き換えることで、第3の世界に変革をもたらす可能性を秘めている。
暗号通貨の負の環境効果は、世界的な気候変動に大きく貢献する可能性がある。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:37:14 GMT)
The Sheaf-Theoretic Structure of Definite Causality [0.0] 我々は、Abramsky と Brandenburger による非局所性のための層理論の枠組みを拡張し、任意の定性因果順序が存在する場合の運用シナリオに対処する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:30:37 GMT)
The Fate of Entanglement [0.0] システムの典型的進化において,様々な形態の多党交絡が消失することを示す。
対照的に、粒子が電子のようなフェルミオンであれば、絡み合いのない領域を妨げる別の絡み合いの概念が存在する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:51:24 GMT)
Teleportation of a qubit using exotic entangled coherent states [0.0] 2つの保存量を導出する古典的なレベルで、エキゾチックなランダウ問題を考察する。
我々は、準ベル状態とラベル付けされたベル状の状態である絡み合ったコヒーレント状態を形成する。
準ベル状態に基づく量子チャネルの非最大性の影響は、量子ビットのテレポーテーションの文脈で研究される。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:03:38 GMT)
Taming the Interacting Particle Langevin Algorithm -- the superlinear case [0.0] 我々は,この非線型性の下で,触覚対話型粒子ランゲヴィンアルゴリズム(tIPLA)と呼ばれる新しい安定なクラスを開発する。
We obtain non-asymptotic convergence error estimates in Wasserstein-2 distance for the new class under an optimal rate。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:24:47 GMT)
TA-RNN: an Attention-based Time-aware Recurrent Neural Network Architecture for Electronic Health Records [0.0] リカレントニューラルネットワーク(RNN)のような深層学習手法を用いて、ERHを分析して疾患の進行をモデル化し、診断を予測する。
本研究では,TA-RNN(Time-Aware RNN)とTA-RNN-Autoencoder(TA-RNN-AE)という,RNNに基づく2つの解釈可能なDLアーキテクチャを提案する。
本研究では,不規則な時間間隔の影響を軽減するため,訪問時間間の時間埋め込みを取り入れることを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 23:57:52 GMT)
Spectral Clustering in Convex and Constrained Settings [0.0] 半定スペクトルクラスタリングにペアワイズ制約をシームレスに統合する新しいフレームワークを提案する。
本手法は,半定スペクトルクラスタリングによって複雑なデータ構造を捕捉する能力を体系的に拡張する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:50:14 GMT)
Spatiotemporal Quenches for Efficient Critical Ground State Preparation in Two-Dimensional Quantum Systems [0.0] 臨界相における急速準備基底状態におけるクエンチの有効性を示す。
シミュレーションにより、光の創発速度における最適クエンチ前速度の存在が明らかとなった。
これらの知見は, 量子系におけるクエンチ時間クエンチの効率的な基底状態生成の可能性を強調した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:00:01 GMT)
Solar synthetic imaging: Introducing denoising diffusion probabilistic models on SDO/AIA data [0.0] 本研究では、生成的深層学習モデル、特にDenoising Diffusion Probabilistic Model (DDPM)を用いて、太陽現象の合成画像を作成することを提案する。
SDO宇宙船に搭載されたAIA機器のデータセットを利用することで、データ不足問題に対処することを目指している。
DDPMのパフォーマンスは、クラスタメトリクス、Frechet Inception Distance (FID)、F1スコアを用いて評価され、現実的な太陽画像を生成する上で有望な結果を示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:18:45 GMT)
Regional biases in image geolocation estimation: a case study with the SenseCity Africa dataset [0.0] 我々は,アフリカ大陸(SCA100)から得られた画像のクラウドソースデータセットに対して,最先端の画像位置推定モデル(ISNs)を適用した。
欧米の高所得国では,ISNsモデルでは画像位置を過大に予測する傾向がみられた。
この結果から,IM2GPS3kを画像位置情報推定のトレーニングセットおよびベンチマークとして用いると,アフリカにおける潜在的な応用を見落としてしまうことが示唆された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:27:24 GMT)
Quantum thermodynamics of nonequilibrium processes in lattice gauge theories [0.0] 強結合熱力学を用いて熱力学量を定義する方法を示す。
我々の定義は、量子シミュレータで実行される簡単な非平衡過程である瞬時クエンチに適合する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:00:03 GMT)
Poincaré symmetries and representations in pseudo-Hermitian quantum field theory [0.0] 本稿では、擬エルミート・ハミルトニアンによる場の量子論を探求する。
PT対称ハミルトニアンは特別な場合として機能する。
我々はポアンカー代数を非エルミート生成元を含むように拡張する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:27:01 GMT)
Optical Text Recognition in Nepali and Bengali: A Transformer-based Approach [0.0] 本稿では,ベンガル文字とネパール文字のテキスト認識について論じる。
ベンガル語話者は約3億人、ネパール語話者は約4000万人である。
その結果,提案手法が現在のアプローチと一致していることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 00:21:14 GMT)
On the power of one pure steered state for EPR-steering with a pair of qubits [0.0] EPR現象(英: EPR phenomenon)とは、あるパーティが2つの測定設定、別のパーティの量子系(Bob)を2つの異なる純粋な状態のアンサンブルに分けることで、あるパーティが操る能力である。
後に量子情報タスクとして形式化されたように、異なるアンサンブルが混合状態を構成する場合でも、EPRステアリングを示すことができる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:27:45 GMT)
On Few-Shot Prompting for Controllable Question-Answer Generation in Narrative Comprehension [0.0] 本稿では,子どもの物語テキストから質問応答ペアの生成を制御するための数発のプロンプト戦略を提案する。
参照モデルと並べて、数発のプロンプトを併用することで、生成プロセスの制御の有効性を示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:17:21 GMT)
Modeling Large-Scale Walking and Cycling Networks: A Machine Learning Approach Using Mobile Phone and Crowdsourced Data [0.0] オーストラリア,ニューサウスウェールズ州の大規模地域ネットワークを横断する日中歩行量とサイクリング量を推定するための機械学習に基づくモデリング手法を開発し,適用した。
この研究では、モデルトレーニング、テスト、推論の3つの側面すべてに関連する、ユニークな課題と制限について論じている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 03:28:48 GMT)
Mean-field theory of 1+1D $\mathbb{Z}_2$ lattice gauge theory with matter [0.0] 格子ゲージ理論(LGT)は、強い相関多体系における問題に対する貴重な洞察を与える。
ここでは、1D+1D $mathbbZ$格子ゲージ理論の平均場理論を開発する。
この単純なLGTは、最先端のコールド原子実験で実装することができる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:45:40 GMT)
Matter waves and clocks do not observe uniform gravitational fields [0.0] 均一な重力場が物質波や時計に与える影響について論じる。
同値原理の一貫した定式化が示すように、一様重力場はこれらの系に観測可能な影響を持たない。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:45:26 GMT)
Machine Learning and Data Analysis Using Posets: A Survey [0.0] ポセットは、データ分析と機械学習の幅広い応用において、ユビキタスな離散数学的構造である。
データサイエンス領域にポーズを接続する研究は、長年にわたって続けられてきた。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:47:44 GMT)
Learning in Convolutional Neural Networks Accelerated by Transfer Entropy [0.0] フィードフォワードネットワークでは、トランスファーエントロピー(TE)を使用して、異なる層に位置するニューロン出力ペア間の関係を定量化することができる。
TEフィードバック接続を統合したCNNアーキテクチャのための新しいトレーニング機構を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:31:49 GMT)
Identifying Climate Targets in National Laws and Policies using Machine Learning [0.0] 我々は,国家法や政策から気候目標の言及を抽出するアプローチを提案する。
ターゲットの3つのカテゴリ('ネットゼロ'、'リダクション'、'その他')を識別するエキスパートアノテートデータセットを作成します。
我々は、我々のモデルに関連するバイアスと株式の影響を調査し、問題のある特徴として特定の年と国名を特定する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 15:55:27 GMT)
Human Activity Recognition using Smartphones [0.0] 私たちは、日々の人間の活動を認識し、消費カロリーをリアルタイムで計算するAndroidアプリケーションを作成しました。
これは、メタボリック等価性に基づく式を用いて、リアルタイムな活動認識とカロリー燃焼の計算に使用される。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:05:41 GMT)
How explainable AI affects human performance: A systematic review of the behavioural consequences of saliency maps [0.0] 透明性マップは、ディープニューラルネットワークがどのように画像を分類するかを説明することができる。
しかし、実際には人間にとって役に立つのだろうか?
68のユーザスタディの体系的なレビューでは、サリエンシマップは人間のパフォーマンスを向上させるが、ヌル効果やコストさえも非常に一般的であることがわかった。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 21:46:25 GMT)
Gaussian Process Regression with Soft Inequality and Monotonicity Constraints [0.0] 確率的手法で物理制約を強制する新しいGP法を提案する。
このGPモデルは量子に着想を得たハミルトンモンテカルロ(QHMC)によって訓練される
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:09:25 GMT)
Financial Risk Management on a Neutral Atom Quantum Processor [0.0] 本稿では、信用格付け低下予測のための量子強化機械学習ソリューションを提案する。
我々は、このソリューションを、実生活データセット上で最大60キュービットの中立原子量子処理ユニットに実装する。
我々は、最先端のランダムフォレストベンチマークに対する競争性能を報告し、一方、我々のモデルは、より良い解釈可能性と同等のトレーニング時間を達成する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 10:04:02 GMT)
Extended Wannier-Stark ladder and particle-pair Bloch oscillations in dimerized non-Hermitian systems [0.0] エネルギー準位は複雑であるが、真のブロッホ周波数で等しく空間化されていることを示す。
そこで本研究では,2種類の非エルミート系について述べる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:06:50 GMT)
Exploring the Impact of Source Code Linearity on the Programmers Comprehension of API Code Examples [0.0] APIコード例におけるソースコードの(a)線形性と(b)長さが,正確性や使用時間の点でユーザパフォーマンスに与える影響について検討した。
61人のJava開発者を対象に,オンラインコード理解実験を行った。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 00:40:38 GMT)
Entropy production and efficiency enhancement in quantum Otto engines operating at negative temperatures [0.0] 周期的古典的および量子熱機械は、ストロークが準静的に実行されるときに高い効率を示す。
本研究では,この反直感的動作を説明するために,エントロピー生成と摩擦加工の概念を利用する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 00:59:56 GMT)
Don't Believe Everything You Read: Enhancing Summarization Interpretability through Automatic Identification of Hallucinations in Large Language Models [0.0] 本稿では,幻覚に対するLarge Language Models (LLM) の振る舞いを深く掘り下げる。
異なる種類の幻覚を識別するためのトークンレベルのアプローチを定義し、さらにトークンレベルのタグ付けを活用してLLMの解釈可能性と忠実性を改善する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 02:49:25 GMT)
Discriminative Sample-Guided and Parameter-Efficient Feature Space Adaptation for Cross-Domain Few-Shot Learning [0.0] クロスドメインの少ショット分類は、それまで見つからなかった領域で新しいクラスを学ぶという難しい課題を示す。
我々は,小データセット上の多数のパラメータの微調整に伴うオーバーフィッティングに対処する,軽量なパラメータ効率適応手法を提案する。
我々は,従来の遠心波を識別的サンプル認識損失関数に置き換え,クラス間およびクラス内分散に対するモデルの感度を高める。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 06:48:15 GMT)
Diagonal Coset Approach to Topological Quantum Computation with Fibonacci Anyons [0.0] 本研究では、フィボナッチ・アロンに基づくトポロジカル量子計算のための有望な共形場理論の実現スキームについて検討する。
量子ゲートはこれらをブレイディングすることで実現される。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:27:23 GMT)
Determining the Tactical Challenge of Scenarios to Efficiently Test Automated Driving Systems [0.0] シナリオの課題を計算するための既存の方法は、メートル法値の観点で課題を表現することを目的としている。
本稿では,シナリオを分析し,それらの課題を説明することによって,この問題を緩和するチャレンジ記述手法を提案する。
異なる高速道路のシナリオにこの手法を適用することで、複雑なシナリオを分析し、理解しやすい説明を提供することができることを示した。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:33:47 GMT)
Demonstration of weighted graph optimization on a Rydberg atom array using local light-shifts [0.0] Rydberg 原子アレイ上での重み付きグラフ最適化の最初の実演を示す。
重み付きグラフを1次元および2次元配列で作成する能力を検証する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 11:42:38 GMT)
Critical Properties of Weak Measurement Induced Phase Transitions in Random Quantum Circuits [0.0] 各種の弱い測定形態が測定誘起相転移の性質に及ぼす影響について検討した。
普遍臨界特性は弱い測度プロトコルの影響を受けず、強い射影測度で見られる普遍性クラスと一致している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 18:00:09 GMT)
Conditions on separability in multiqubit systems with an accelerating qubit using a conditional entropy [0.0] 多ビット純および混合GHZおよびW状態における加速量子ビットの分離性は、Abe Rajagopal (AR) $ q $-conditional entropy を用いて特徴づけられた。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:18:39 GMT)
Comment on "Machine learning conservation laws from differential equations" [0.0] 著者が1D減衰型高調波発振器の運動定数を導出した6ヶ月後、著者を引用せずに同様の結果が得られた。
彼らの導出には6つの重大な誤りが含まれており、その方法と結果の両方が間違っていた。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 17:53:32 GMT)
Chatbots as social companions: How people perceive consciousness, human likeness, and social health benefits in machines [0.0] チャットボットを定期的に利用している人と、それを使用していない人について検討した。
期待とは対照的に、コンパニオンユーザーはこれらの関係が社会的健康に有益であることを示した。
相手のチャットボットを、より意識的で人間らしく認識することは、より肯定的な意見と、より顕著な社会的健康上の利益と相関している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 19:32:34 GMT)
Certification of two-qubit quantum systems with temporal inequality [0.0] 観測された測定統計に基づく量子デバイスの自己検査は、最小限の資源を用いて量子システムを認証する手法である。
本稿では,互換性条件を仮定することなく,上記の2量子状態と測定値の証明を行うセルフテストプロトコルを提案する。
本プロトコルは,非文脈不等式から導かれる時間的不等式が最大値に違反する原因となる逐次相関の観測に基づく。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 12:41:48 GMT)
Certification of multi-qubit quantum systems with temporal inequalities [0.0] マルチキュービットシステムにおける非文脈不等式から導かれる時間的不等式を提案する。
本研究では,新たな不等式が逐次測定シナリオによって最大値に違反できることを実証する。
マルチキュービットグラフ状態と測定値の認証が可能である。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:08:11 GMT)
Can We Understand Plasticity Through Neural Collapse? [0.0] 本稿では,近年の深層学習における2つの現象,すなわち可塑性損失と神経崩壊の関連について検討する。
これらの相関関係を異なるシナリオで分析し、最初のタスクでの最初のトレーニングフェーズの間に有意な関連性を明らかにする。
神経崩壊を緩和する正規化手法を導入し,その有効性を示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 13:21:58 GMT)
Automatic Extraction of Linguistic Description from Fuzzy Rule Base [0.0] 神経ファジィシステムは説明可能な人工知能(XAI)の技法である
本稿では,自然言語におけるファジィ規則の自動抽出について述べる。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:50:48 GMT)
Automatic Coral Detection with YOLO: A Deep Learning Approach for Efficient and Accurate Coral Reef Monitoring [0.0] サンゴ礁は、人為的な影響や気候変動によって脅威にさらされている重要な生態系である。
本稿では,深層学習モデルを用いたサンゴ自動検出システムを提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:00:46 GMT)
Are fermionic quantum critical systems more entangled? [0.0] 量子臨界系における解離部分領域間の絡み合いについて検討する。
我々は、共形場の理論やそれに対応する格子ハミルトニアンを含む任意の次元の系を扱う。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 16:19:54 GMT)
Analyzing Economic Convergence Across the Americas: A Survival Analysis Approach to GDP per Capita Trajectories [0.0] 本研究は,1人当たりのGDPを120ヶ月(2013-2022年)で5%増加させるという時間的ダイナミクスについて検討した。
比較調査では、DeepSurvは非線形相互作用を捉えるのに熟練しているが、標準的なモデルは特定の状況下で同等のパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 07:27:59 GMT)
An inversion problem for optical spectrum data via physics-guided machine learning [0.0] 測定された光学スペクトルからペアリンググルー関数を導出する問題を解くために,正則化リカレント推論装置(rRIM)を提案する。
rRIMは、トレーニングと推論の両方に物理原則を取り入れ、ノイズの堅牢性、アウト・オブ・ディストリビューションデータによる柔軟性、データ要求の削減を実現している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 01:02:06 GMT)
Adaptive Sampling Policies Imply Biased Beliefs: A Generalization of the Hot Stove Effect [0.0] ホットストーブ効果(Hot Stove Effect)は、学習の適応性から生じる負性バイアスである。
負の見積もりが必ずしも回避に繋がるのではなく、より小さいサンプルサイズに繋がることを示す。
また,ベイズ学習者には,ほとんどの学習者が期待する代替案の価値を過小評価しているという意味で,負性バイアスがあることも示している。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 09:15:38 GMT)
Active learning for efficient annotation in precision agriculture: a use-case on crop-weed semantic segmentation [0.0] アクティブラーニングは、大きな未ラベルプールから最も情報性の高い画像の識別と選択を容易にする。
アクティブな学習は、Cityscapesのようなベンチマークデータセットで有望な結果を示しているが、農業領域におけるパフォーマンスは、まだ明らかにされていない。
本研究は,3つの能動的学習に基づく獲得関数の比較研究を行うことにより,この研究ギャップに対処する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 08:55:44 GMT)
ANOVA-boosting for Random Fourier Features [0.0] 我々のアルゴリズムは、重要な入力変数と変数の相互作用のインデックスセットを確実に見つけることができる。
我々のアルゴリズムは解釈可能性の利点があり、つまり、全ての入力変数の影響が学習モデルで知られていることを意味する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 20:34:18 GMT)
A coarse-grained description of anharmonic lattice environments affecting the quantum dynamics of charge carriers [0.0] 格子の柔らかさは凝縮物質系における電荷キャリアのダイナミクスに大きな影響を及ぼす。
最近の研究は、格子振動のクォート的不調和性の寄与を示唆している。
2つの安定状態を持つ環境の影響下で量子力学を記述する理論を提案する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 05:02:46 GMT)
A Novel Approach to Breast Cancer Histopathological Image Classification Using Cross-Colour Space Feature Fusion and Quantum-Classical Stack Ensemble Method [0.0] 乳癌の分類は、タイムリーな診断と効果的な治療を確実にするための重要な柱である。
本研究は、乳がん分類の精度を高めるために、色空間アンサンブルと量子古典的積み重ねの相乗効果を利用する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:26:50 GMT)
A Model for Integrating Generative AI into Course Content Development [0.0] GAIDEは、ジェネレーティブAI(GenAI)を使用して教育コンテンツ作成を促進するための新しいフレームワークである。
コンテンツ開発を効率化し、動的材料の開発を奨励し、教育設計におけるGenAIの有用性を実証することを目的としている。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:24:43 GMT)
A Bayesian Regression Approach for Estimating the Impact of COVID-19 on Consumer Behavior in the Restaurant Industry [0.0] 本研究の目的は、新型コロナウイルスによる飲食店に対する消費者行動の変化点を推定することである。
本手法は,パンデミック前後の顧客の行動変化を把握し,計算分析における新しい手法を強調する。
論文参考訳(メタデータ) (Wed, 3 Apr 2024 04:25:07 GMT)