13992259 kvcache ai 1752753766
3
A KVCache-centric Disaggregated Architecture for LLM Serving
C++
3小时前
3
MegEngine 是一个快速、可拓展、易于使用且支持自动求导的深度学习框架
343543 huiwei13 1607412231
1
针对部分场景仅需检测最大的单人脸,新增最大人脸检测测试接口,不同场景整体速度波动将会更大,但单人脸场景提升较明显
1
This is a c++ implement of yolov5 and fire/smoke detect.
1
Flash Attention series, including flash attention-1, 2, 3
C++
12个月前
0
ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架
C++
4个月前

搜索帮助