淘淘宅课程出品,必属精品,关注公众号 [淘淘宅] 获取最新资源。
人工智能技术近 10 年得到了飞速的发展,这不仅仅是依靠大数据的支撑,更是计算机芯片算力不断提升的结果,而实现超级算力的核心就是 AI 芯片。AI 芯片也被称为人工智能加速器,即专门用于处理人工智能应用中的大量计算任务的模块。如何借助 AI 芯片来实现特定的任务,是所有AI芯片产业人员必备的技能。
为此,贪心学院重磅推出高性能神经网络与 AI 芯片应用研修课程,为想进入 AI 芯片行业的同学们提供一个可以大幅提升自身就业竞争力的选择。
本课程会讲解 AI 芯片相关知识、高性能网络设计、通用芯片及专用芯片计算加速方法等专业技能,并结合优秀编译器的架构和实现细节的讲解,为学生构建高性能 AI 算法的软硬件视角,能够解决应用落地时神经网络的优化和部署相关问题。
课程目录
第一周:轻量化网络结构设计
本节课将讲解网络参数量、浮点运算数等模型评价指标、工具,以及分类网络, 检测网络,分割网络的轻量化设计。
课程提纲:
轻量化网络设计背景介绍
网络的计算量和内存分析工具
主干网络的轻量化
检测网络的轻量化
分割网络的轻量化
典型网络的设计思路
第二周:知识蒸馏优化、低秩分解优化
本节课将讲解神经网络知识蒸馏优化、神经网络计算低秩分解加速计算方法。
课程提纲:
知识蒸馏方法介绍
知识蒸馏原理和步骤介绍
知识蒸馏训练方法缩减网络的实际分类网络演示
低秩分解原理
低秩分解加速计算在神经网络推理中的应用
第三周:网络剪枝
本节课将讲解网络稀疏性原理,网络剪枝原则及剪枝的常见方法。
课程提纲:
网络剪枝的原理
常用的剪枝策略
神经网络框架中的剪枝功能介绍
剪枝的实际使用
第四周:网络量化
本节课将讲解网络的低比特化,以及在AI芯片中的计算,实现网络量化的离线和在线感知的量化方法。
课程提纲:
网络量化的技术发展
不同离线量化算法的实现原理
神经网络框架中在线感知量化算法的原理及实现
实际案例
第五周:神经网络编译器简介
本节课将讲解tvm、ncnn、tnn、mnn的简要对比,tvm relay和网络转换,网络的编译优化和推理加速。
课程提纲:
tvm、ncnn、tnn、mnn的简要对比
tvm relay和网络转换
网络的编译优化和推理加速
tvm的实际案例
第六周:ncnn
本节课将讲解ncnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。
课程提纲:
ncnn的系统架构图
ncnn的数据结构及支持框架
ncnn的网络表示
ncnn网络优化,量化,及各平台的优化策略
第七周:tnn
本节课将讲解tnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。
课程提纲:
tnn的系统架构图
tnn的数据结构及支持框架
tnn的网络表示
tnn网络优化,量化,及各平台的优化策略
第八周:mnn
本节课将讲解mnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。
课程提纲:
mnn的系统架构图
mnn的数据结构及支持框架
mnn的网络表示
mnn网络优化,量化,及各平台的优化策略
第九周:cpu中的指令集优化
本节课将讲解cpu中的指令集优化,simd、avx、sse方法,及tvm中对于cpu上神经网络加速的位置。
课程提纲:
cpu中的指令集优化:simd,avx,sse方法
tvm中对于cpu上神经网络加速的位置
第十周:arm中的神经网络加速
本节课将讲解arm中的neon优化,及ncnn,tnn和mnn的实现,并结合实际例子来看具体的加速效果。
课程提纲:
arm中的neon优化
ncnn,tnn和mnn实现的讲解
具体加速效果的实际案例
第十一周:卷积计算的优化算法
本节课将讲解卷积计算的优化算法,包括winograd等。
第十二周:神经网络加速库
本节课将讲解openblas库的优化,nnpack/qnnpack的优化,及lowpgemm。
课程提纲:
openblas库的优化
nnpack/qnnpack的优化
lowpgemm
第十三周:gpu上神经网络的运行和加速
本节课将讲解gpu与cpu计算加速的区别,英伟达gpu的原生cuda加速方法,及推理侧tensorrt的使用。
课程提纲:
gpu与cpu计算加速的区别
英伟达gpu的原生cuda加速方法
推理侧tensorrt的使用
第十四周:gpu加速通用加速库
本节课将讲解通用加速库cublas,vulkan,opencl的使用。
课程提纲:
通用加速库cublas的使用
Vulkan的使用
opencl的使用
第十五周:dsp,fpga,npu专用加速计算
本节课将讲解dsp,fpga,npu的专用加速计算。
课程提纲:
dsp计算加速
fpga计算加速
npu专用加速计算
第十六周:npu使用
本节课将以嘉楠科技的k210为例,实现一个人脸检测案例。
课程提纲:
嘉楠科技k210芯片介绍
nncase人脸检测案例