Tengine-Lite v1.0 版本更新啦!!!重要的事情要打三个感叹号!!!
小O妹和组员肝了不知多少个日日夜夜,这期间被催促,被质疑,小O妹都坚强的挺了过来。上线的那一刻差点哇的哭出来。
更新内容如下:
新特性:
a. Tengine-Lite开源异构计算切图功能,本版本支持CPU+GPU异构,后续版本敬请期待CPU+NPU (闲来大佬主刀(*❦ω❦),我们会开个专门的话题来给大家详细讲一讲实现方式)
b. 新增armv8.2 fp16精度推理,支持fp32/fp16混合精度模式
c. Tengine-Lite支持Vulkan GPU(适配高通/NV Xavier/x86独立GPU等),终于支持Vulkan了,撒花~
example:MobileNet + MobilenetSSD(CPU GPU异构)
d. Tengine-Lite支持Arm Mali GPU(ACL)
example:MobileNet + MobilenetSSD(CPU GPU异构)
**e.**C++ API(实验性支持)
**f.**Python API(实验性支持)
新网络支持:
- landmark
- yolact
- openpose
- yolov4
新算子支持:
a. 新增UINT8 算子ref,小伙伴们可以结合我们的全套模型转换工具、量化工具,在x86、arm平台上验证一下流程啦虽然速度还不算快,不过这里给大家埋(wa)个(ge)伏笔(keng),UINT8在哪里跑的快呢
- concat
- clip
- convolution
- detection_out
- dropout
- eltwise
- fc
- flatten
- pooling
- premute
- priorbox
- reshape
- softmax
支持模型UINT8格式模型 MobileNetv1、SqueezeNetv1.1、ResNet18、ResNet50、GoogleNet、VGG16、MobileNetv2、Inceptionv3、MobileNetSSD
b. 新增Mish激活函数
推理性能:
a. arm多线程推理性能优化(openmp)
b. x86性能算子优化
GitHub链接如下,欢迎大家Watch,star,Fork三连支持