20 notes

Technical Writing

Notes and long-form summaries on machine learning, NLP, reinforcement learning, vector retrieval, model training, and engineering practice.

Browse by tag

20 notes

2022.04.24

Transformer模型优化及加速概览

NLP

2022.04.09

图神经网络简介

GNN

2022.03.24

Gumbel-Softmax

可微的离散变量采样

RL VAE

2021.08.15

模型训练性能调优笔记

Model Training

2021.06.26

置信域策略优化算法

TRPO & PPO

2021.06.19

向量相似度查找方法汇总

Vector Similarity Search

Deployment

2021.04.04

Tour of Scala

学习笔记

Blog

2021.02.17

层次聚类

Hierarchical Clustering Methods

Clustering

2021.02.14

Transformer家族模型总结

Transformer's family

NLP

2021.01.31

深度学习之——Normalization

Normalization Techniques

CV DL

2020.12.20

NLP任务评价指标

NLP evaluation metrics

NLP

2020.11.17

模型压缩

Model Compression

Model Training Deployment

2020.11.03

强化学习之——策略梯度

Policy Gradient

RL DL

2020.11.03

强化学习之——A2C算法

Advantage Actor Critic Algorithm

RL DL

2020.11.02

少样本学习

Few-shot Learning

Few-Shot Learning

2020.10.31

分布式机器学习

Distributed Machine Learning

Distributed System Deployment

2020.10.15

强化学习之——DQN的变种

DQN variants

RL DL

2020.10.07

强化学习之——DQN

DQN

RL DL

2020.10.07

强化学习之——基础介绍

fundamentals

RL DL

2020.10.07

强化学习之——算法分类

Algorithm Classification

RL DL