Tachyum发布1600页性能优化手册,尽管流片一再推迟且无实际芯片面世
4 天前 / 阅读约3分钟
来源:Tomshardware
Tachyum发布了1600页的Prodigy通用处理器FPGA硬件性能优化指南,该处理器面临多次延期,具有独特的指令集架构和优化策略,指南提供了AI和HPC软件开发的优化技术。

(图片来源: Tachyum)

Tachyum公司近日发布了一份长达1600页的手册,旨在优化其Prodigy通用处理器的FPGA硬件性能。尽管Prodigy处理器尚未成功流片,但Tachyum已提前发布了这份针对这些潜在芯片的性能优化手册。这些芯片拥有独特的指令集架构和优化策略,而手册的发布远早于实际产品开始抽样或上市。

自最初规划以来,Prodigy通用处理器的发布时间已多次推迟。原定于2019年流片、2020年发布的计划已多次变更:从2021年推迟至2022年,再推迟至2023年,最后又延期至2024年。今年早些时候,Tachyum再次更新计划,表示将在2025年进行流片,并将原定于明年第一季度上市的参考服务器样品推迟。尽管公司仍计划在2025年开始大规模生产Prodigy处理器,但能否在一年内完成所有必要流程(流片、调试、抽样、大规模生产启动)仍待观察。

Tachyum的Prodigy设计采用了192个基于全新微架构的定制64位计算核心,这种架构既适用于通用计算,也适用于高度并行的AI和HPC计算。其指令集架构(ISA)融合了RISC和CISC设计的优点,避免了传统CISC处理器中常见的复杂、冗长且低效的可变长度指令。所有指令均标准化为32位或64位,部分指令还包含内存访问功能,以进一步提升性能。

Tachyum的Prodigy FPGA内置了性能计数器,能够实时监视和分析运行时事件。这些工具使程序员和工程师能够轻松识别瓶颈并优化代码,提高运行效率,使处理器成为执行计算密集型任务的理想选择。

手册中详细介绍了具体的优化技术,包括管理调度限制、改进内存例程、对齐分支和指令以及缓解寄存器转发挑战等。此外,还提供了处理缓存操作、加载/存储对齐和访问特殊寄存器的指导,确保开发人员能够微调软件以实现峰值性能。

Tachyum的创始人兼首席执行官Radoslav Danilak博士表示:“这份手册将为软件程序员、测试工程师、编译器开发人员以及系统和解决方案工程师提供深入了解Prodigy的机会,了解它如何为AI、云和HPC工作负载提供固有的性能优势。Prodigy的集成功能将助力用户实现行业领先的计算效率,从而更快获得见解、推进研究和生成结果。”

然而,值得注意的是,尽管Tachyum已发布详细的性能优化手册,但迄今为止,该公司尚未成功流片出任何芯片。真正的考验仍在于实际产品的性能表现。

简体中文 繁體中文 English 日本語 Deutsch 한국 사람 русский بالعربية TÜRKÇE português คนไทย Français