巨大的运算量 因距离向和方位向都要进行脉冲压缩,故运算量非常大。以8 192×8 192点图像为例,若两个方向都采用匹配滤波方法,一共需要进行32 768次8 192点FFT运算;若采用基2方法,仅FFT运算就需要1 280万次复数乘法,3 432万次复数加法。设合成孔径时间是5 s,则在一个合成孔径时间内算出一幅图像要求处理器的有效运算能力在10亿FLOPS以上,因此必须采用多处理器结构。
处理的并发性和流水性 原始数据一般是以回波到达顺序进入信号处理机,这样在距离向处理时可采用流水方式进行,流水线以子孔径为单位分级。方位向的参数估计往往需要整个孔径长度的方位回波,所以方位向处理要等到在整个孔径上完成距离向处理后才开始并发执行。因此不仅要考虑整体的流水操作,还要考虑距离向处理和方位向处理的差异。 巨大的通信数据率 在进行参数估计和计算校正函数以及匹配函数时往往要用到数据的部分或全部样本,由于运算集中在计算FFT上,处理器能够花费在参数估计上的时间已非常有限,读取数据的时间就更少了,这就要求在处理器的各模块之间有良好的拓扑结构和很高的数据传输速率。
2、 PCI Express总线技术
2.1 PCI Express总线简介
在基于PCI总线的PC世界或工控领域里,随着网络流量的不断提高,PCI和PCI-X的多点并行架构的瓶颈越来越突出,而PCI Express架构具有更高的性能,可以突破此类瓶颈的限制。PCI Express架构采用串行输入/输出结构,每条通道在每个方向上的发送和接收数据速率高达2.5 Gb/s,最新的PCI Express 2.0的数据速率更是高达5 Gb/s,具有更好的可扩展性,可提供更高的带宽。由于PCI和PCI-X总线采用共享多点并行总线架构,所以当总线中的插槽和设备数量增加时,有限的总线资源会被多个设备共享,于是带宽就会相应的下降。PCI和PCI-X采用平行的、多点下传的连接架构,很容易产生串扰现象,此外所有的信号线必须完全等长,否则无法将信号同步传到另一端,而会产生信号扭曲。这些问题让PCI的时钟频率难以提升,电压也难以下降,造成速度提升上的发展限制。而PCI Express采用序列的、点对点的连接架构,收发数据差分传输,可以避免信号不同步并且减少干扰。PCIExpress带宽随着通道数的增加而增加,如表1所示。
PCI Express是全新第三代I/O串行总线标准,其性能超越了以前的PCI标准。但是PCI、PCI-X与PCI Express仍将在未来的一段时间内共存。PCI Express可提供专用的、高性能的、可扩展的带宽总线和卓越的以太网性能,其功能远远超越了PCI和PCI-X的共享多点架构。从软件上看,采用PCI-Express架构可以兼容所有为PCI设备编写的软件。