超标量(superscalar)试图在一个周期取出多条指令并行执行,是通过内置多条流水线来同时执行多个处理,其实质是以空间换取时间。但由于指令之间的相关性,即后一条指令需要前一条指令的结果,超标量CPU的性能是一个周期能执行1.2条指令,而为了取得这20%的性能改善,超标量CPU需要增加大量的硬件电路来调度这些同时取出的指令,比如寄存器重命名,预约站,重排序缓冲区等[1] 。
超标量CPU不可能再进一步调高性能了,这是由于指令的并行度ILP所决定的,及时编译器可以使用诸如循环展开优化技术,超标量CPU对性能的改善也很有限。