LittleFish’Blog
写点东西,吐点槽
首页
归档
历史归档
文章分类
文章标签
关于
搜索
首页
归档
历史归档
文章分类
文章标签
关于
搜索
标签:
LLM (10)
开发 (8)
算法 (3)
工具 (1)
系统 (1)
NLP (1)
Python (1)
Bug (1)
GPT (1)
ChatGPT (1)
LeetCode (1)
译文 (1)
🗒️
[bug] vllm低资源部署服务运行一段时间后卡死
技术分享
|
2023-11-09
开发
Bug
vllm低资源部署服务运行一段时间后卡死,初步确定为GPU内存较小,较长的prompt和生成导致kv cache使用率接近或者达到100%,从而卡死。
文章详情
1
0%