-
Notifications
You must be signed in to change notification settings - Fork 785
Open
Description
System Info / 系統信息
xinference==v0.13.3
Running Xinference with Docker? / 是否使用 Docker 运行 Xinfernece?
- docker / docker
- pip install / 通过 pip install 安装
- installation from source / 从源码安装
Version info / 版本信息
xinference==v0.13.3
The command used to start Xinference / 用以启动 xinference 的命令
opt/conda/bin/python /opt/conda/bin/xinference-worker --metrics-exporter-port 9998 -e http://10.6.208.95:9997/ -H 10.6.208.95
Reproduction / 复现过程
对于单个请求,如果client主动断开了请求,请求没有正常的被abort而是继续执行完成了。
Expected behavior / 期待表现
当client断开请求后,应该迅速调用engine.abort(request_id)关闭当前的请求,而不浪费GPU推理资源。