财通证券:架构创新突破大模型推理延迟瓶颈 广阔市场空间有望快速放量

lnradio.com 4 0

智通财经APP获悉,财通证券发布研报称,LPU为新一代面向大模型推理阶段的芯片,核心为TSP架构。该行认为,LPU受益于低推理延时的优异表现,有望实现快速渗透,该行看好LPU的高成长性及LPU以机柜出货时带来的PCB机会,建议关注:智微智能(001339.SZ)(参股元川微)、星宸科技(301536.SZ)(多轮增资元川微)、沪电股份(002463.SZ)(英伟达PCB供应商)、胜宏科技(300476.SZ)(英伟达PCB供应商)、深南电路(002916.SZ)。

财通证券主要观点如下:

LPU为新一代面向大模型推理阶段的芯片,核心为TSP架构

LPU是专为顺序处理的计算密集型任务设计的新型芯片架构,核心在于TSP架构,包含五大功能模块,将经典的处理器五级流水线拆散在整个芯片内,进而消除了硬件的复杂性,使指令执行顺序和时间具有确定性。在TSP架构下,编译器可以直接访问并精确控制芯片的底层硬件状态,实现了软件定义硬件。

LPU可缩短大模型推理过程中的延迟,提高用户体验感

大模型在推理过程中会存在延迟,延迟与用户体验感精密挂钩,大模型推理过程中的延迟主要在Decode阶段,核心瓶颈在于内存带宽。LPU具备更快的内存带宽,可缩短大模型推理过程中的延迟。同时,基于LPU的大模型不仅具有更快的推理速度,还可以提供更具性价比的价格,可进一步提高用户体验感。

LPU具备广阔的潜在发展空间,已步入量产初期

目前Tokens的消耗量大幅增长,2024年初我国日均Token的消耗量为1000亿,2026年2月主流大模型合计日均Token消耗已到180万亿级别,Tokens消耗量快速增长,带动推理芯片市场规模的高增长。LPU可降低大模型推理的延迟,该行认为LPU有望在推理芯片市场中逐步渗透,具有高成长性的市场空间。目前LPU已步入量产初期,放量在即。

风险提示:AI技术迭代不及预期的风险;大模型发展不及预期的风险;LPU行业发展不及预期的风险。