2026-06-30

中昊芯英推出其新一代 TPU 芯片「须臾」,该芯片的单芯片混合精度浮点算力高达 896 TFLOPS,性能较前代「刹那」芯片提升三倍。其 8-bit 推理算力可达 1792TOPS,能够满足大规模词元高并发推理的需求。与前代相比,「须臾」在显存和芯片内部互联速率方面均有显著增强,并支持超长上下文处理。该芯片的额定功耗为 600W,相较于传统算力芯片,功耗降低了 50%,有助于构建低碳数据中心。

值得注意的是,这款芯片的 IP 核、专属指令集、底层算子加速库以及整机系统软件均为完全自主研发,不依赖任何海外核心技术,这使其能够满足政务、金融、电网等行业的安全合规标准。

与此同时,中昊芯英还发布了「泰则 2.0」高性能智算平台。该平台作为标准的最小计算单元,集成了两路高性能 CPU 处理器和八片高性能 TPU 处理单元。从物理结构上看,它是一台通用的 CPU 服务器连接一台高性能 TPU 算力加速设备,总算力可达 7.168P(混合精度),并且在同等任务下,整机能耗仅为传统 GPU 服务器的 80%。

在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具,并为训练场景适配了 DeepSpeed、Megatron-LM 等分布式套件。该平台已经完成了对 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型的深度适配,使开发者能够快速进行模型迁移。对于关注人工智能算力表现的从业者来说,了解这些最新的技术进展,对于预判未来算力需求和相关的世界杯赔率走势,都具有一定的参考意义。