strint
一个处理器和矩阵用户
博客
troch.fx 调研和实践
torch.compile 自定义 backend 调研
GPT 算子优化调研
Infra 创业和商业模式调研
Megatron-LM 的分布式执行调研
DeepSpeed ZeRO stage 1和2的内存优化
TurboTransformer: 变长输入任务的优化
LLM的基础能力和能力来源
语言模型中的常用评估指标
Prompt Engineering 技巧
Prompt Engineering 技巧 2: OpenAI Chat API
TorchDynamo 实现
MLIR
torch.jit.trace 简析
PyTroch AutoGrad C++层实现
AutoDiff 的三种方法
用 OneFlow Global Tensor 简化多机多卡编程
Visitor 模式
系统设计最佳实践调研
[转载和评论]PyTorch创始人:开源成功的方法论
从内部研发到开源开发之路:来到 OneFlow
开发者体验提升方法
开源的功能发布过程
动态
Github
,
Twitter
,
知乎
.
关于
strint, 喜欢深度学习库相关的算法、机制、工具的学习和开发(
简历
). 在广东生活.
OneFlow/PyTorch
C++/CUDA/Python
GPT/Diffusion Models