时间:2026-01-04 来源:FPGA_UCY 关于我们 0
在具有广阔发展前景的AI芯片中,FPGA是灵活可编程硬件平台,其计算性能高、可定制性强,可为AI算法提供加速与优化;在AI应用方面,可应用于神经网络加速器,高性能计算单元等以提供计算密集型AI任务高性能低延迟计算能力。可是占有率为何这么低呢?未来的增长点有哪些?
长期以来,FPGA设计与开发都比较繁杂,要求具备专业的硬件设计与编程技能;另外,相对于专用AI芯片而言,FPGA无论是功耗还是性能比都没有明显的优势,从而一定程度地影响FPGA对AI方案的应用。
然而FPGA厂商每年都会增加AI方面的努力,如引入AI应用专用平台及解决方案以提供更易使用且性能更高的产品等。与此同时,开发工具与框架的日臻完善也使得利用FPGA来实现AI特性这一门槛越来越低,从而引起越来越多开发者与商家对FPGA技术的青睐。
面向AI,FPGA软硬兼修
还在2018年左右,Xilinx(现已被AMD收购)已经洞察到了FPGA在算力市场的巨大价值,提出了“数据中心优先”的战略,随后发布了自适应计算加速平台 (Adaptive Compute Acceleration Platform,ACAP) Versal。这一产品形态已经脱离了传统的FPGA范畴,通过内部的可编程引擎,它引入多个以自适应数据流的方式来组织的AI Core,作为承载AI等数据密集型运算的主体。
也就是说,Xilinx FPGA的AI路线相当于是设计了一套专门的硬件体系来承载AI等数据密集型运算,Versal ACAP将标量处理引擎,自适应硬件引擎及智能引擎与最前沿的存储器及接口技术集成到一起,使异构加速性能上得到改善。
不同于Xilinx通过独立于传统FPGA结构之外的独立硬件组成单元(AI Core阵列)承载AI,Intel FPGA的AI技术路线相对保守,主要对FPGA中嵌入的DSP模块进行直接提升,使其成为AI张量,但是其仍然属于FPGA中的一个构成模块。
传统FPGA中乘累加多依赖于DSP模块。为追求高度灵活性,常用DSP模块为一两个乘法器,加上加法器组成。这样就可以基于这种基本的DSP模块配合FPGA的其它部分构成各种不同的运算算法。
由于AI算法的核心是大量的乘加/乘累加,不是一般的乘加,而是一种“张量”运算。所以促进FPGA实现AI算法的途径自然是将DSP模块提升到更适合AI张量运算,而这恰恰是Intel技术路线所在。
Intel第一款采用张量模块的FPGA是2020年推出的Stratix 10 NX,其张量模块架构主要针对AI计算中常用的矩阵-矩阵或矢量-矩阵乘法和加法运算进行了优化,那时可以支持INT8、INT4两种数据计算方式,通过共享指数来支持FP16、FP12区块浮点数字格式。
![]()
利用AI张量模块增强型DSP介绍了两个崭新而重要的操作,一个是面向AI张量处理能力,另一个是在信号处理应用中支持复数,这类应用包括快速傅立叶变换(FFT)和复有限脉冲响应(FIR)滤波器。第一个模型可以通过INT8的张量模型来加强AI。第2种新花样为复数运算,以往复数乘法需2个DSP模块才能完成,而经过优化,1个使用AI张量模块增强DSP即可完成16位定点复数乘法运算。这些革新不仅奠定了Intel FPGA开发的基础,而且成为Intel在最近几年面向边缘AI方面的一个重要支持。
Xilinx与Intel两条线也是目前FPGA AI化主要技术途径,尤其Xilinx这一高度可配置与可扩展架构设计已经成为目前FPGA开展异构融合设计工作的主流模式。
在软件领域,HLS(High Level Synthesis,高层次综合)技术在最近几年的大型FPGA学术会议中是学术界与工业界最为关注的领域之一。HLS把如C++,OpenCL这些高层语言通过具体的编译工具可直接转换为可在FPGA中运行的硬件代码;AMD与Intel均拥有自己的HLS工具与开发套件。
近年来,开发工具链也越来越丰富,包括集成开发环境(IDE)、仿真器、调试器等,可以帮助开发者在FPGA上开发、调试和验证AI应用程序,提高开发效率和质量。
边缘AI,中端FPGA潜能巨大
FPGA产品按性能,成本及大小可分为小型,中型及大型FPGA产品,与市场俗称的低,中,高端应用相对应。
低端FPGA具有低功耗、低成本和小体积优势,适用于边缘计算和IoT设备中。由于边缘计算要求在设备端进行实时的数据处理和决策,低端FPGA适合在边缘设备中实现AI推理任务。例如,用于智能摄像头、智能家居设备、传感器节点等,实现图像识别、语音识别和运动检测等功能。此外,低端FPGA还可以用于小规模的机器学习模型训练和优化。
中端FPGA在AI领域的机会较为广泛,由于具有较高的性能和资源,它适合处理更复杂的AI任务,例如在图像和视频处理、自动驾驶、工业自动化等领域,可用于加速计算、优化算法和实现实时推理。同时,中端FPGA还可以与其他硬件加速器结合使用,构建混合加速平台,实现更高效的AI计算。
高端FPGA在AI领域的机会则主要集中在高性能计算和数据中心加速方面,它具有大规模的逻辑资源、高存储容量和高时钟频率,能够支持更复杂和大规模的AI模型训练和推理任务。
随着AI应用越来越多转向比集中式云数据中心更低的延迟、更安全和私密的处理,高端FPGA特性延伸到中端应用的趋势非常明显,网络边缘计算、智能终端设备等市场呈现出巨大的发展潜力,国内外相关厂商纷纷加大了中端FPGA领域的布局。
工业摄像头就是很好的应用案例之一。工业摄像头由于体积小、散热条件不佳,但对带宽要求越来越高,属于典型的“既需要一定性能、又要求低功耗”的应用。此外还有汽车ADAS包括MDC方面的应用,以及汽车显示等方面,都越来越需要更强的处理能力、更高的处理带宽。中端FPGA的低功耗、高性能就非常适合这类应用。
![]()
之前专注于低功耗FPGA的Lattice,近年来就在加大中端FPGA的布局,其策略可以解读为“通过基于专用平台的方法来满足市场需求”。在该公司看来,市场上的许多中端FPGA器件都是采用大型FPGA的架构开发的,其底层架构保持不变,只是某些功能发生了变化。由于这些架构主要是为高性能计算应用而设计的,因此这种方法会导致优化不佳,尤其是在功耗和物理尺寸方面。
相比以前拥有100K~150K逻辑单元的FPGA产品,Lattice推出了逻辑单元数量500K的FPGA产品,同时在互联性能、封装尺寸、性能方面进行了优化,使之更适合中端应用需求。
Intel也开始重视中端FPGA的市场机会,尽管前几年,英特尔推出的FPGA产品都更侧重高端应用市场,但随着Agilex D系列FPGA和代号Sundance Mesa的Agilex FPGA的推出,Intel将会更多关注中端应用市场。
还有一个值得注意的趋势,就是“高端和中端FPGA之间的界限越来越趋于模糊。过去几年,中端FPGA应用发生了很大变化,目前已经演进为需要更高的性能和更低的功耗,高端FPGA将延伸到中端应用中;与此同时,一些低端应用又对产品有更高需求。这就意味着,需要打造具备更低功耗和密度的产品。
国产FPGA厂商也开始面向AI进行创新。京微齐力近期就宣布在其FPGA中采用了Imagination的Series3NX AI核,以适用于AIoT应用、边缘端AI视频分析处理应用等。京微齐力这一做法是将FPGA、CPU、AI等多种异构计算单元集成在同一个芯片上,强调了“硬件的可重构特性”,这种混合架构的平台芯片比单一架构更能支持高定制水平和能效提升。
写在最后
FPGA最关键的价值是可编程性和灵活性;AI开发之初,许多新兴应用尚处于孕育之中,各种标准尚处于进化之中;AI算法推陈出新,对硬件的算力及灵活度都有较高要求,而FPGA正好符合了上述要求。另外在推理环节小批量数据处理时,FPGA可以依靠流水线并行实现高并行低延迟。并且,受低延迟、数据隐私和带宽限制等因素驱动,FPGA能够满足低功耗、灵活以及快速响应等需求。
行业数据表明,2021-2027年FPGA市场有望继续以每年12%复合增长率增长至130亿美元。中国市场的增长有望较快,今后5年内增长率仍将维持在18%左右。由于面向AI的应用升级,预计FPGA将在汽车,工业和其他传统非FPGA应用领域迎来全新机遇。
![]()
— 丰科卓辰 —