资讯分类
全部资讯
最新活动
商城公告
行业信息
新品推荐
元器件知识
资讯标签
艾迈斯欧司朗(96) 英伟达NVIDIA(70) 艾为awinic(45) 飞腾派V3(37) 萤火工场(30) 罗彻斯特电子(28) Jetson Orin Nano SUPER 开发套件(21) 资料下载专区(18) 进迭时空(15) 兆易创新(14) 艾为 awinic(14) 赛昉科技(StarFive)(12) 灵动微电子(11) 小华半导体(9) 日清纺微电子(9) Seeed矽递科技(8) 上海雷卯Leiditech(8) 微源半导体 LPSemi(8) 赛昉科技(8) NVIDIA(8) 龙芯中科(7) GD32VW553-IOT(7) 物奇WuQi(7) 庆科(5) 开源口碑分享(5) 日清纺微电子Nisshinbo(5) 飞腾派(4) 创捷电子(4) TROQ创捷电子(4) Geehy极海半导体(4) 航顺芯片(4) CEM5826-M11(4) FTHR-G0001(3) 罗彻斯特(3) 飞腾派eMMC(3) iCEasy商城(3) MM32SPIN060G(3) 一件包邮专区(3) 极海(2) 中国星坤(2) 极海半导体(2) 小华EVB-HC32F4A0开发板(2) 国产开源硬件(2) 野火(2) 杭晶(HCI)(2) Mini-SPIN0230(2) NVIDIA品牌专区(2) 华润微电子(2) 口碑评测(2) EVB-L0130(2) 教育优惠申请链接(2) 启明云端(2) 飞腾官网飞腾派(2) 弈安云(2) 飞腾派下载专区(2) 村田(2) 英伟达初创加速计划(2) 飞虹半导体(1) MUSE Paper(1) 8月7日竞拍竞买(1) 飞腾派V3版本上新(1) 萤火工场GD32VW553-IOT(1) 野火RK3566开发板(1) 乐动机器人(1) 海凌科电子(Hi-Link)(1) VF202040-A0(1) 教育优惠(1) 松科智能(1) 润石(1) 格力新元(1) CEM5825F(1) COMBO模组 EMC3020-PZI5(1) 附件(1) Jetson AGX Thor 开发套件/模组(1) Mini-F5333(1) 微源半导体(1) 周年抽奖活动(1) 庆科信息(MXCHIP)品牌专区(1) 附件下载地址(1) 迈巨微(1) 华大北斗(1) GD32无线生态专区(1) JETSON_AGX_ORIN_64GB_DEVELOPER_KIT(1) QCS6490 SOM EVB开发板(1) 申请样片:高光效红光OSCONIQ® P 3030, GR QSSPA1.23(1) 台容积电(1) 雷克沙(1) GD32VW553-IOT V2版本(1) QCS8550 SOM EVB开发板(1) 商城下载专区(1) GD32VW553-IOT V2(1) CEM5881-M11(1) NVIDIA Jetson Orin Nano 开发套件(1) 萤火工场品牌专区(1) 进迭时空品牌页(1) 飞腾人才赋能(1) Jetson AGX Orin 64GB开发套件(1) 荣湃半导体(2Pai Semi)品牌专区(1) 下载专区(1) B站风扇视频(1) Jetson AGX Xavier(32GB)(1) BeagleBoard.org®(1) 社区评奖活动(1) Arduino UNO Rev 4 Minima开发板(1) 国产自主可控(1) 英伟达 NVIDIA(1) CEM5861G-M11(1) 赛昉科技9折活动券(1) NVIDIA Jetson Orin Nano 开发套件(1) Arduino品牌专区(1) NVIDIA DGX™ Spark:桌面级AI超级计算机(1) 品牌清仓(1) QCS8550 SOM EVB(1) Jetson AGX Orin 64GB开发套件(1) 24GHz毫米波雷达模块(1) 技术问答专区(1) 英特尔(1) NVIDIA Jetson Nano 模组(1) QCS6490 SOM EVB(1) 天微电子商家页(1) 国产毫米波雷达模块(1) 飞腾派专链(1) 瑞隆源产品(1) 龙芯教育派(1) CEK8902-S905D3(1) EV Board (MM32L0136C7P)(1) 迈巨微电子品牌专区(1) BeagleBone Black快速入门指南(1) 样片申请(1) NVIDIA NIM(1) 世野(Khadas)(1) 618大促(1) 竞买活动(1) 雷卯(1) 飞腾派试用申请链接(1) 飞腾派调研问卷链接(1) 微雪电子(1) 一件免邮专区(1) SFH 7018B(1) 极海半导体(Geehy)(1) Arduino品牌页(1) 英伟达 NVIDIA品牌专区(1) 小脚丫(1) 618大促专区(1) 艾为(AWINIC)(1)

赛昉科技 | RISC-V向量处理器:现代计算的革命性引擎

发布时间:2025-06-04

在数字化高速发展的当下,人工智能、大数据处理、物联网等前沿技术日新月异,现代计算需求面临着严峻挑战。海量数据的爆发式增长,让传统计算架构在处理大规模数据时显得力不从心,效率低下、能耗过高、处理速度瓶颈等问题愈发突出。以人工智能领域为例,深度学习模型训练需要进行海量矩阵运算和复杂的神经网络计算,对计算设备的计算能力和并行处理能力要求极高;在大数据分析场景中,快速处理TB甚至PB级数据,传统架构难以在可接受时间内完成任务。这些挑战迫切需要计算架构创新,以突破现有局限,满足不断增长的计算需求。

为应对上述难题,向量扩展(Vector Extension,RVV)作为RISC-V指令集架构的重要拓展被正式引入。RISC-V指令集架构以其开源开放特性著称,赋予了开发者在设计处理器时极大的灵活性与可扩展性,可针对不同应用场景进行定制化设计。RVV向量扩展通过引入向量指令,实现了对多个数据元素的并行处理,为提升计算性能提供了全新的途径。相较于传统的标量计算模式,向量计算在多媒体数据处理、科学计算等领域展现出显著优势,能够有效减少指令执行次数,进而降低计算延迟,全面提升系统整体性能。RVV的出现,为开发者提供了一种高效、灵活且具有成本效益的解决方案,有力推动了计算架构的创新发展,在诸多领域呈现出巨大的应用潜力。在RVV发展浪潮中,赛昉科技昉 · 天枢-83(Dubhe-83) CPU IP 崭露头角。

昉·天枢-83 RISC-V CPU IP


Dubhe-83是一款能效卓越的处理器,具备诸多先进特性:


1. 指令集支持

全面兼容RVA23与RVV Crypto指令集,赋予芯片卓越的指令处理能力,从容应对复杂计算任务。在加密应用场景中,RVV Crypto指令集提供硬件级加密加速,极大提升数据加密与解密效率,为数据安全提供坚实保障。

2. 前端取指和分支预测策略

前端取指和分支预测采用Decouple策略,将取指和分支预测两个关键操作解耦,更高效地处理指令流。同时,分支预测采用业界先进的TAGE-Style算法,能更精准预测程序分支走向,减少因分支预测错误导致的流水线停顿,提升处理器执行效率。

3. 流水线设计

拥有10-14 Stage的Pipeline,合理的流水线深度设计在保障指令处理效率的同时,兼顾硬件复杂度与成本。通过多级流水线操作,指令可在不同阶段并行处理,加快指令执行速度。

4. 解码和提交机制

采用3-Way Decode/Rename/Commit机制,可同时对三条指令进行解码、重命名和提交操作,进一步提升指令处理并行度,提高处理器整体性能。

5. 性能表现

在Benchmark SPECint2006测试中,Dubhe-83分数达9.4/GHz,充分展现其在整数计算性能方面的出色表现,能满足多种对整数运算要求较高的应用场景。


Dubhe-83在RVV上具有显著的技术亮点和优势:


1. 向量计算单元设计

Dubhe-83的Vector的VLEN=DLEN=256,配备2条128-bit的计算单元。此设计大幅提升向量计算能力,可同时处理2x128-bit的数据元素,在向量运算中充分发挥并行计算优势,加速数据处理。

2. 存储加载单元(LSU)设计

LSU采用2条Pipeline实现方式,Vector Load/Store和 Scalar Load/Store深度融合。Vector Load/Store带宽为2x128-bit,这种融合设计在满足高带宽需求的同时尽可能节省资源(面积)的开销,在数据加载和存储过程中,无论是向量数据还是标量数据,均可高效传输和处理,减少数据访问延迟,提高数据处理效率。

3. 向量工作方式与指令实现

Vector支持LMUL工作方式,每条Vector宏指令采用拆分uop实现方式。只要uop的所有Element在连续两个Cache Line范围内,则该 uop可一次性完成读/写操作。该设计优化了向量指令执行过程,减少指令执行周期,提升向量带宽。

4. 向量Load/Store uop实现优势

Vector Load/Store采用拆分uop实现方式,相较于一些厂商拆分Element的实现方式,在绝大多数应用场景中具有绝对性能优势。这种实现方式能更高效利用存储带宽,减少数据传输次数,提高数据加载和存储效率,进而提升整个系统性能。

5. 乱序执行机制

不仅Scalar采用深度乱序实现方式,Vector也采用深度乱序实现机制。与Vector按序实现方式相比,乱序方式能天然解决许多数据依赖场景。在实际应用中,数据间存在复杂依赖关系,按序执行可能因数据未准备好导致流水线停顿,而乱序执行可灵活调整指令执行顺序,优先执行不依赖未就绪数据的uop,显著提升性能。

6. RVV性能表现

与市场上一些通过In-Order实现的RVV产品相比,Dubhe-83在RiVEC基准测试套件(RiVEC Benchmark Suite,是一个由来自不同领域的数据并行应用程序组成的集合,该套件专注于对向量微架构进行基准测试,各个case的描述详见下表格)上有着显著的性能提升,提升从最少22%(Pathfinder)到最高817%(Matmul),其中,应用于高性能计算领域的几个BLAS算子模型的平均性能提升为357.55%,应用于金融分析/物理仿真/数据挖掘等领域的几个Dense Linear Algebra算子模型的平均性能提升为315.70%。这些实际应用场景中的性能优势,充分证明 Dubhe-83在RVV架构和微架构上的先进性和卓越性能表现,能更好满足用户对高性能计算的需求。

RiVEC Benchmark Suite



想要了解及购买赛昉科技(StarFive)产品,请前往iCEasy商城品牌专区:

https://www.iceasy.com/starfive

iCEasy商城欢迎您的到来!