Categories
技术探索
科研笔记
课业学习
项目总结
课余学习
2025
从 FlexGen 入门 LLM (1) —— 模型结构
晟腾 Atlas 800I A2 服务器部署 DeepSeek-R1-Distill-Llama-70B 模型
分布式文件系统+Raft+MapReduce,CHFS项目总结
成果分享 | Goal-Driven Reasoning in DatalogMTL with Magic Sets 解读
《CMU 10-414 Deep Learning System》课程学习笔记(下篇)
采用LLVM IR,Tiger编译器完整实现及解析
SJTU软件工程《算法设计》复习笔记
2024
投机推理(Speculative Inference)的两篇论文
论文精读 | PowerInfer: Fast Large Language Model Serving with a Consumer-grade GPU
实现一个微型深度学习框架Needle
《CMU 10-414 Deep Learning System》课程学习笔记(上篇)
不联网 在手机本地就能用的大模型?MLC LLM 端侧部署 LLM 指南
采用键值分离,LSM KV 键值存储系统项目总结
SJTU软件工程《高级数据结构》复习笔记
2023
[MIT] The Missing Semester of Your CS Education 学习笔记