BLAZAR BE2-RMW/BE3-RMW 加速器引擎
Peraso 的 BLAZAR BE2-RMW/BE3-RMW 加速器引擎具有智能的存储器内 BURST 传输以及 RMW 计算和决策功能
Peraso's BLAZAR 加速器引擎系列支持高带宽、快速的随机存储器访问速率和存储器嵌入式函数 (IMF),可以解决内存瓶颈应用程序的关键内存访问挑战,例如网络搜索、统计、缓冲、安全性、防火墙、8k 视频、异常检测、基因组学、树的 ML 随机森林、图/树/列表遍历和流量监控。
Bandwidth Engine 2 RMW (BE2-RMW) 结合了 576 Mb 的高速串行存储器和存储器中的带宽函数,而 Bandwidth Engine 3 RMW (BE3-RMW) 提供了高达 1.152 Gb 的带宽。IMF 减少了诸如 BURST 和 RMW 之类的存储命令的数量,支持用以进行数据移动的 2、4 或 8 个顺序读写的单个存储器命令,并减少了存储器命令周期。Bandwidth Engine RMW 非常适合可以使用较大的 SRAM 容量来提高性能的任何系统以及作为 QDR 的替代,只需更简单的设计即可实现更高性能。BE2 支持高达 320 Gbps 的带宽,BE3 支持高达 380 Gbps 的带宽,并提供 640 Gbps 版本。
框图
- 576 Mb (BE2) 和 1.152 Gb (BE3) 高速 1 T 存储设备:
- 替换 4 个 QDR 器件 (BE2) 和 8 个 QDR 器件 (BE3)
- 高访问速率 SRAM 类存储器
- 高循环率存储器
- 每秒高达 65 亿笔交易
- 3.2 ns tRC
- 4 个分区/64 个存储区(BE3 最多为 128 个)并支持同时访问
- 2 个 8 通道独立接口端口:
- 每个端口都是独立的,允许双端口运行
- 高带宽、低引脚数串行接口
- 仅使用 32 个引脚连接到 FPGA 或 ASIC(最多可使用 8 个引脚)
- 比 QDR 的 I/O 引脚减少多达 7 倍
- 板载信号自适应功能简化了板卡布局和信号完整性
- 所需的走线长度最小,可通过连接器工作
- BE2 的 SerDes 速率为 12.5 Gbps,BE3 的 SerDes 速率为 15.6 Gbps(25 Gbps 可用于更高的带宽)
- I/O 引脚上每秒高达 330 亿笔交易,而 BE3 每秒高达 65 亿笔交易
- 管理功能:
- 器件上的调度程序
- 8 个调度域(可选)
- Peraso 提供的 RTL 存储器控制器允许用户定义存储器字长
- 例如 x8、x16、x32、x36、x64、x72
- 存储器带宽函数:
- 猝发顺序读和写函数,用于数据移动,带宽几乎增加了一倍
- 猝发长度:1、2、4、8 个字
- 借助 IMF 提供优于 QDR 的性能
- BE2 可以同时执行 8 次读取和 8 次写入,而 BE3 最多进行 16 次读取/写入
- BE2/BE3-ALU 的 RMW(读取/修改/写入)计算和决策功能
- 诸如 ADD、SUB、INC、比较等函数
- 封装:
- BE2 BURST (19 mm x 19 mm)
- BE3 BURST (27 mm x 27 mm)
- 性能:
- 单芯片带宽
- BE2 为 320 Gbps
- BE3 为 380 Gbps(提供 640 Gbps 版本)
- 借助 IMF 提供优于 QDR 的性能:
- 消除了大量的系统存储器命令
- 节省的存储器循环时间可提高应用程序性能
- 网络搜索
- 统计
- 缓冲
- 安全
- 防火墙
- 8k 视频
- 异常检测
- 基因组学
- ML 树随机森林
- 图/树/列表遍历
- 流量监控
BLAZAR BE2-RMW/BE3-RMW Accelerator Engines
图片 | 制造商零件编号 | 描述 | 存储器组织 | 访问时间 | 封装/外壳 | 可供货数量 | 价格 | 查看详情 | |
---|---|---|---|---|---|---|---|---|---|
MSR820AJC288-12 | IC SRAM 576MBIT PAR 324PBGA | 8M x 72 | 2.6 ns | 324-BGA | 0 - 立即发货 | $3,616.55 | 查看详情 | ||
MSR830AGC-1512 | IC SRAM 1GBIT PAR 676BGA | 16M x 72 | 2.7 ns | 676-BGA | 0 - 立即发货 | $5,104.10 | 查看详情 |