资讯分类
全部资讯
最新活动
商城公告
行业信息
新品推荐
元器件知识
资讯标签
艾迈斯欧司朗(95) 英伟达NVIDIA(70) 艾为awinic(45) 飞腾派V3(37) 萤火工场(30) 罗彻斯特电子(28) Jetson Orin Nano SUPER 开发套件(21) 资料下载专区(18) 进迭时空(15) 兆易创新(14) 艾为 awinic(13) 赛昉科技(StarFive)(12) 灵动微电子(11) 小华半导体(9) 日清纺微电子(9) Seeed矽递科技(8) 上海雷卯Leiditech(8) 微源半导体 LPSemi(8) 赛昉科技(8) NVIDIA(8) 龙芯中科(7) GD32VW553-IOT(7) 物奇WuQi(7) 庆科(5) 开源口碑分享(5) 日清纺微电子Nisshinbo(5) 飞腾派(4) 创捷电子(4) TROQ创捷电子(4) Geehy极海半导体(4) 航顺芯片(4) CEM5826-M11(4) FTHR-G0001(3) 罗彻斯特(3) 飞腾派eMMC(3) iCEasy商城(3) MM32SPIN060G(3) 一件包邮专区(3) 极海(2) 中国星坤(2) 极海半导体(2) 小华EVB-HC32F4A0开发板(2) 国产开源硬件(2) 野火(2) 杭晶(HCI)(2) Mini-SPIN0230(2) NVIDIA品牌专区(2) 华润微电子(2) 口碑评测(2) EVB-L0130(2) 教育优惠申请链接(2) 启明云端(2) 飞腾官网飞腾派(2) 弈安云(2) 飞腾派下载专区(2) 村田(2) 英伟达初创加速计划(2) 飞虹半导体(1) MUSE Paper(1) 8月7日竞拍竞买(1) 飞腾派V3版本上新(1) 萤火工场GD32VW553-IOT(1) 野火RK3566开发板(1) 乐动机器人(1) 海凌科电子(Hi-Link)(1) VF202040-A0(1) 教育优惠(1) 松科智能(1) 润石(1) 格力新元(1) CEM5825F(1) COMBO模组 EMC3020-PZI5(1) 附件(1) Jetson AGX Thor 开发套件/模组(1) Mini-F5333(1) 微源半导体(1) 周年抽奖活动(1) 庆科信息(MXCHIP)品牌专区(1) 附件下载地址(1) 迈巨微(1) 华大北斗(1) GD32无线生态专区(1) JETSON_AGX_ORIN_64GB_DEVELOPER_KIT(1) QCS6490 SOM EVB开发板(1) 申请样片:高光效红光OSCONIQ® P 3030, GR QSSPA1.23(1) 台容积电(1) 雷克沙(1) GD32VW553-IOT V2版本(1) QCS8550 SOM EVB开发板(1) 商城下载专区(1) GD32VW553-IOT V2(1) CEM5881-M11(1) NVIDIA Jetson Orin Nano 开发套件(1) 萤火工场品牌专区(1) 进迭时空品牌页(1) 飞腾人才赋能(1) Jetson AGX Orin 64GB开发套件(1) 荣湃半导体(2Pai Semi)品牌专区(1) 下载专区(1) B站风扇视频(1) Jetson AGX Xavier(32GB)(1) BeagleBoard.org®(1) 社区评奖活动(1) Arduino UNO Rev 4 Minima开发板(1) 国产自主可控(1) 英伟达 NVIDIA(1) CEM5861G-M11(1) 赛昉科技9折活动券(1) NVIDIA Jetson Orin Nano 开发套件(1) Arduino品牌专区(1) NVIDIA DGX™ Spark:桌面级AI超级计算机(1) 品牌清仓(1) QCS8550 SOM EVB(1) Jetson AGX Orin 64GB开发套件(1) 24GHz毫米波雷达模块(1) 技术问答专区(1) 英特尔(1) NVIDIA Jetson Nano 模组(1) QCS6490 SOM EVB(1) 天微电子商家页(1) 国产毫米波雷达模块(1) 飞腾派专链(1) 瑞隆源产品(1) 龙芯教育派(1) CEK8902-S905D3(1) EV Board (MM32L0136C7P)(1) 迈巨微电子品牌专区(1) BeagleBone Black快速入门指南(1) 样片申请(1) NVIDIA NIM(1) 世野(Khadas)(1) 618大促(1) 竞买活动(1) 雷卯(1) 飞腾派试用申请链接(1) 飞腾派调研问卷链接(1) 微雪电子(1) 一件免邮专区(1) SFH 7018B(1) 极海半导体(Geehy)(1) Arduino品牌页(1) 英伟达 NVIDIA品牌专区(1) 小脚丫(1) 618大促专区(1) 艾为(AWINIC)(1)

进迭时空RISC-V Vector技术实践

发布时间:2025-05-23

在CPU核的设计中,SIMD(single instruction multiple data,单指令多数据)是一种常用的数据并行处理方式,通过一条指令同时对多个数据元素进行操作以提升处理器的计算效率和运行速度。SIMD具有广泛的应用场景,例如图像处理、科学计算、加解密、机器学习和人工智能等。随着应用对算力需求的不断提高,处理器的数据并行能力也随之增长(例如intel的SIMD ISA进化,寄存器从MMX的64-bit进化到如今AVX的512-bit)。但这种传统SIMD指令的编程模型决定了其寄存器长度(即并行度)是嵌入在指令中的,软硬件的耦合度很高,每次硬件的并行度升级都需要软件进行相应的适配,带来额外的软件工作量。

相较于传统SIMD指令,RISC-V指令集向量扩展RISC-V Vector采用了更加灵活的编程模型,在提供单指令多数据并行处理的同时,为开发者提供了更高层次的抽象,使得软硬件更加解耦,软件无需感知硬件并行度的变化,直接适配于不同的硬件配置。

我们以RISC-V Vector1.0指令集为例。从图中可以看到,对于向量寄存器宽度(VLEN)不同的硬件,同一套程序可以直接运行,唯一区别是VLEN越大的处理器每轮迭代所能够处理的元素个数越多,因此所需要的循环次数越少。此外,由于指令集所定义的element mask功能,在最后一轮迭代时,超出的元素将被无效掉,而无需类似SIMD指令那样对循环末梢的元素进行额外的特殊处理。

进迭时空RISC-V Vector技术实践


进迭时空第一代RISC-V CPU核X60和RISC-V AI核A60已完整支持RISC-V Vector 1.0扩展,并应用于RISC-V AI CPU芯片K1中。该系列核支持VLEN=256-bit的向量寄存器宽度,提供最大2x128-bit的数据并行处理能力,支持INT/FP等多种计算精度。同时,A60还基于向量寄存器扩展了符合IME标准的AI指令,提供2Tops INT8融合AI算力。

我们基于SWAN测试集对K1的向量能力进行了测试和优化。SWAN是一套用于测试向量指令在多媒体、图像处理等数据密集型应用中性能表现的基准测试集,其针对chromium、WebRTC、PDFium 等应用的软件库进行性能分析,测试涵盖了图像编解码、卷积计算、色彩空间转换等典型算法。

在SWAN的所有37个测试中,向量指令相较于标量指令均获得了明显的加速比,尤其是在低精度高并行度的测试上,向量的加速效果可达数十倍。

此外,相较于Cortex-A55的SIMD指令, 在相同频率下,K1芯片的Vector指令测试表现:

· 51%的测试项性能达到 Cortex-A55 的 1.5 倍以上(最高 2.5 倍);

· 21%的测试项性能达到 Cortex-A55 的 1~1.5 倍;

由于配置了更宽的向量寄存器和数据处理宽度,K1在数据并行度高的程序上获得了更大的收益,例如ibjpeg、skia等典型的图像测试程序的性能上甚至可达50%~100%的提升。此外,软件优化也是向量化非常重要的一个环节。程序的算法及指令调度优化会对测试结果有影响,在针对性进行优化调整之后,向量化的程度和整体性能都有明显提升,这也是RISC-V Vector指令集软件生态在实际应用场景中需要不断积累优化的地方。



想要了解及购买进迭时空产品,请前往iCEasy商城品牌专区:

https://s.iceasy.com/1Pjqx1

iCEasy商城欢迎您的到来!