知识图谱Knowledge Graph构建与应用
《新一代人工智能发展规划》明确提出了“建立新一代人工智能关键共性技术体系”的重点任务,特别强调了要解决“研究跨媒体统一表征、关联理解与知识挖掘、知识图谱构建与学、知识演化与推理、智能描述与生成等技术,开发跨媒体分析推理引擎与验证系统”的关键共性技术问题。一、知识图谱概论1.1知识图谱的起源和历史1.2知识图谱的发展史——从框架、本体论、语义网、链
GoCoding GoCoding
2年前
TensorRT 开始
TensorRT是NVIDIA自家的高性能推理库,其列出了各资料入口,如下:本文基于当前的TensorRT8.2版本,将一步步介绍从安装,直到加速推理自己的ONNX模型。安装进选择版本下载,需注册登录。本文选择了TensorRT8.2.2.1.Linux.x8664gnu.cuda11.4.cudnn8.2.tar.gz,可以注意
Easter79 Easter79
3年前
Tengine快速上手指南(中文版)
Tengine是一个优秀的轻量级端侧/嵌入式环境深度神经网络推理引擎。兼容多种操作系统和深度学习算法,以AI推理框架为基础的AIoT开发套件。本文档将分别在x86Linux和Arm64Linux平台,以分类模型(TensorFlowMobileNetv1模型)为例,带你快速上手Tengine。Linuxx86平台编译
GoCoding GoCoding
1年前
Flutter ncnn 使用
Flutter实现手机端App,如果想利用AI模型添加新颖的功能,那么ncnn就是一种可考虑的手机端推理模型的框架。本文即是Flutter上使用ncnn做模型推理的实践分享。
使用Triton部署chatglm2-6b模型 | 京东云技术团队
一、技术介绍NVIDIATritonInferenceServer是一个针对CPU和GPU进行优化的云端和推理的解决方案。支持的模型类型包括TensorRT、TensorFlow、PyTorch(metallama/Llama27b)、Python(cha
京东云开发者 京东云开发者
9个月前
京东广告算法架构体系建设--高性能计算方案最佳实践 | 京东零售广告技术团队
1、前言推荐领域算法模型的在线推理是一个对高并发、高实时有较强要求的场景。算法最初是基于Wide&Deep相对简单的网络结构进行建模,容易满足高实时、高并发的推理性能要求。但随着广告模型效果优化进入深水区,基于Transformer用户行为序列和Atten
京东云开发者 京东云开发者
8个月前
京东广告算法架构体系建设--高性能计算方案最佳实践
1、前言推荐领域算法模型的在线推理是一个对高并发、高实时有较强要求的场景。算法最初是基于Wide&Deep相对简单的网络结构进行建模,容易满足高实时、高并发的推理性能要求。但随着广告模型效果优化进入深水区,基于Transformer用户行为序列和Atten
司马炎 司马炎
1年前
【MindStudio训练营第一季】MindStudio 高精度对比随笔
MindStudio精度对比简介原因:训练场景下,迁移原始网络(如TensorFlow、PyTorch),用于NPU上执行训练,网络迁移可能会造成自有实现的算子运算结果与用原生标准算子运算结果存在偏差。推理场景下,ATC模型转换过
GPT大语言模型Alpaca-lora本地化部署实践【大语言模型实践一】 | 京东云技术团队
本文进行本地化部署实践的Alpacalora模型就是Alpaca模型的低阶适配版本。本文将对Alpacalora模型本地化部署、微调和推理过程进行实践并描述相关步骤。