(资料图片)
金山办公与NVIDIA团队合作,通过NVIDIA Tensor Core GPU、TensorRT提升图像文档识别与理解的推理效率;借助NVIDIA Triton推理服务器的部署,成功优化GPU利用率,提供高推理吞吐量。相比于CPU其pipeline耗时共下降84%;采用NVIDIA Triton推理服务器部署,其部署成本节省了23%。(金山办公)