传统芯片在晶圆上以网格模式打印,然后切割成数百个小型芯片,而Cerebras的晶圆级集成则跳过了这种切割步骤,直接将整个晶圆设计成一个单一的超大芯片,因此称为“晶圆级”引擎。该方案通过将海量的计算资源和存储资源集中在单一的超大规模芯片(晶圆)上,优化了数据传输路径,减少了延迟,显著提高了推理速度。