推理所有文章-最新推理相关文章汇总-HelloWorld开发者社区

•

4年前

TensorRT是NVIDIA自家的高性能推理库，其列出了各资料入口，如下：本文基于当前的TensorRT8.2版本，将一步步介绍从安装，直到加速推理自己的ONNX模型。安装进选择版本下载，需注册登录。本文选择了TensorRT8.2.2.1.Linux.x8664gnu.cuda11.4.cudnn8.2.tar.gz，可以注意

GoCoding

•

2年前

Flutter ncnn 使用

Flutter实现手机端App，如果想利用AI模型添加新颖的功能，那么ncnn就是一种可考虑的手机端推理模型的框架。本文即是Flutter上使用ncnn做模型推理的实践分享。

京东云开发者

•

2年前

京东广告算法架构体系建设--高性能计算方案最佳实践 | 京东零售广告技术团队

1、前言推荐领域算法模型的在线推理是一个对高并发、高实时有较强要求的场景。算法最初是基于Wide&Deep相对简单的网络结构进行建模，容易满足高实时、高并发的推理性能要求。但随着广告模型效果优化进入深水区，基于Transformer用户行为序列和Atten

京东云开发者

•

1年前

京东广告算法架构体系建设--高性能计算方案最佳实践

1、前言推荐领域算法模型的在线推理是一个对高并发、高实时有较强要求的场景。算法最初是基于Wide&Deep相对简单的网络结构进行建模，容易满足高实时、高并发的推理性能要求。但随着广告模型效果优化进入深水区，基于Transformer用户行为序列和Atten

AGIC.TWang

•

1年前

大模型推理GPT | DeepSeek | Doubao

AIGC发展到现在，大模型已经逐渐在大家的知识探索、学习知识、搜索领域的重要帮手，那么从普通大众认知角度，到底能做到什么程度，我们选三个当前知名度较高的大模型进行验证和对比。GPT4o：OpenAI大模型代表，大模型的标杆DeepSeek：深度求索的大模型，当前最火爆的大模型，低成本高效能的杰出代表。（也是作为开发者的我最喜爱的大模型）Doubao：字节跳动的大模型，也是国内断崖领先的大模型应用豆包的底层模型。（豆包App是基于该大模型的应用，做了大量其他辅助工作，如搜索等，因此该大模型表现的能力，不能完全和豆包App划等号）