20 notes
Technical Writing
Notes and long-form summaries on machine learning, NLP, reinforcement learning, vector retrieval, model training, and engineering practice.
20 notes
图神经网络简介
GNN
Gumbel-Softmax
可微的离散变量采样
置信域策略优化算法
TRPO & PPO
向量相似度查找方法汇总
Vector Similarity Search
Tour of Scala
学习笔记
层次聚类
Hierarchical Clustering Methods
Transformer家族模型总结
Transformer's family
深度学习之——Normalization
Normalization Techniques
NLP任务评价指标
NLP evaluation metrics
模型压缩
Model Compression
强化学习之——策略梯度
Policy Gradient
强化学习之——A2C算法
Advantage Actor Critic Algorithm
少样本学习
Few-shot Learning
分布式机器学习
Distributed Machine Learning
强化学习之——DQN的变种
DQN variants
强化学习之——DQN
DQN
强化学习之——基础介绍
fundamentals
强化学习之——算法分类
Algorithm Classification
No matching notes.