推荐
专栏
教程
课程
飞鹅
本次共找到51条
推理
相关的信息
GoCoding
•
3年前
TensorRT 开始
TensorRT是NVIDIA自家的高性能推理库,其列出了各资料入口,如下:本文基于当前的TensorRT8.2版本,将一步步介绍从安装,直到加速推理自己的ONNX模型。安装进选择版本下载,需注册登录。本文选择了TensorRT8.2.2.1.Linux.x8664gnu.cuda11.4.cudnn8.2.tar.gz,可以注意
Easter79
•
3年前
Tengine快速上手指南(中文版)
Tengine是一个优秀的轻量级端侧/嵌入式环境深度神经网络推理引擎。兼容多种操作系统和深度学习算法,以AI推理框架为基础的AIoT开发套件。本文档将分别在x86Linux和Arm64Linux平台,以分类模型(TensorFlowMobileNetv1模型)为例,带你快速上手Tengine。Linuxx86平台编译
京东云开发者
•
1年前
京东广告算法架构体系建设--高性能计算方案最佳实践 | 京东零售广告技术团队
1、前言推荐领域算法模型的在线推理是一个对高并发、高实时有较强要求的场景。算法最初是基于Wide&Deep相对简单的网络结构进行建模,容易满足高实时、高并发的推理性能要求。但随着广告模型效果优化进入深水区,基于Transformer用户行为序列和Atten
京东云开发者
•
1年前
京东广告算法架构体系建设--高性能计算方案最佳实践
1、前言推荐领域算法模型的在线推理是一个对高并发、高实时有较强要求的场景。算法最初是基于Wide&Deep相对简单的网络结构进行建模,容易满足高实时、高并发的推理性能要求。但随着广告模型效果优化进入深水区,基于Transformer用户行为序列和Atten
AGIC.TWang
•
4个月前
大模型推理GPT | DeepSeek | Doubao
AIGC发展到现在,大模型已经逐渐在大家的知识探索、学习知识、搜索领域的重要帮手,那么从普通大众认知角度,到底能做到什么程度,我们选三个当前知名度较高的大模型进行验证和对比。GPT4o:OpenAI大模型代表,大模型的标杆DeepSeek:深度求索的大模型,当前最火爆的大模型,低成本高效能的杰出代表。(也是作为开发者的我最喜爱的大模型)Doubao:字节跳动的大模型,也是国内断崖领先的大模型应用豆包的底层模型。(豆包App是基于该大模型的应用,做了大量其他辅助工作,如搜索等,因此该大模型表现的能力,不能完全和豆包App划等号)
近屿智能
•
1个月前
谷歌最强模型 Gemini 2.5 Pro 发布,近屿智能带你学AI大模型
近日,谷歌宣布推出“最智能的AI模型”Gemini2.5系列,实验版Gemini2.5Pro是该系列上线的首款推理模型。这个模型专为复杂任务打造,推理能力强大,一经诞生就横扫各大榜单、拿下各类TOP1,还创下了历史上最大分数飞跃纪录。目前,该模型已在Goo
近屿智能
•
3星期前
OpenAI 最强推理模型o3 和 o4-mini 正式发布,近屿智能带你入局AI
近日,OpenAI正式发布了o3和o4mini模型,代表着ChatGPT能力的重大飞跃。o3堪称最强大的推理模型,o4mini则针对快速且具成本效益的推理进行了优化。这两款模型均展现出卓越的推理能力,能智能调用ChatGPT中的各类工具,像搜索网络、运用P
近屿智能
•
1星期前
小米开源“Xiaomi MiMo”模型,近屿智能带你系统掌握AI大模型应用
近期,小米大模型团队通过“XiaomiMiMo”官方公众号发布重磅消息,宣布成立专注推理能力的大模型核心研发团队,并正式推出首款自研大模型XiaomiMiMo,同时实现全面开源。作为一个参数仅为7B的小体量模型,MiMo在数学推理测评集AIME2425及代
近屿智能
•
6小时前
超越 DeepSeek-R1,英伟达新模型登顶,近屿智能专注大模型人才培养
近日,英伟达发布全新开源模型系列LlamaNemotron,凭借卓越性能引发业界关注,有望重塑开源AI格局。该系列在推理能力上超越DeepSeekR1,内存效率与吞吐量显著提升。其创新采用合成数据监督微调与强化学习训练,全方位增强模型推理能力。系列包含LN
GoCoding
•
1年前
Flutter ncnn 使用
Flutter实现手机端App,如果想利用AI模型添加新颖的功能,那么ncnn就是一种可考虑的手机端推理模型的框架。本文即是Flutter上使用ncnn做模型推理的实践分享。
1
2
3
4
5
6