程序性能优化
创始人
2024-06-03 08:32:41

1. 消除循环的低效率

如:

 for (i = O ; i < vec_length (v); i++) 

可改为:

long length = vec_length (v) ;

for (i = O ; i < length ; i++)

这样就不会每次循环时都调用vec_length函数,每次函数调用的开销很大。

2. 减少过程调用

如:

for (i = O ; i < length ; i++) {
        data_t val ;
        get_vec_element (v , i , &val) ;
        *dest = *dest OP val ;
}

可改为:

data_t *data = get_vec_start (v) ;
*dest = IDENT ;
for (i = O ; i < length ; i++) {
        *dest = *dest OP data [i] ;

这样每个循环中通过数组还引用具体数据,而不是在循环中进行函数调用。

3. 消除不必要的内存引用

如:

data_t *data = get_vec_start (v) ;
*dest = IDENT ;
for (i = O ; i < length ; i++) {
        *dest = *dest OP data [i] ;

可改为:

data_t •data = get_vec_start (v) ;
data_t acc = IDENT ;
for (i = O ; i < length ; i++) {
        acc = acc OP dat a [i) ;

*dest = acc ;

这样在循环中直接引用变量,该变量会存放在寄存器中,能够快速访问,最后循环结束再将结果写回内存,从而减少了内存访问。

4. 提高并行性

如:

for (i = O ; i < length ; i++) {
        acc = acc OP dat a [i) ;

可改为:

data_t accO = !DENT;
data_t acc1 = !DENT;
I* Combine 2 elements at a time *I
for (i = O; i < limit; i+=2) {
        accO = accO OP data[i];
        acc1 = acc1 OP data[i+1];

I* Finish any remaining elements *I
for (; i < length; i++) {
        accO = accO OP data[i];

*dest = accO OP accl;

首先, 它减少了不直接有助于程序结果的操作的数量, 例如循环索引计算和条件分支。 第二,它可以充分利用CPU的多个功能单元以及它们的流水线能力,在一个循环体中同时并行执行多个操作,提高并行计算能力。

5. 书写适合用条件传送实现的代码

如:

fo r ( i = O; i < n; i++) {
        if (a[i] > b[i] ) {
                long t = a[i];
                a[i] = b[i];
                b[i] = t;
        }

可改为:

for ( i = O; ]. < n; i++) {
        long min = a[i] < b[i] ? a[i] : b[i]
        long max = a[i] < b[i] ? b[i] : a[i]
        a[i] = min;
        b[i] = max;
}

相关内容

热门资讯

防震演练进校园 筑牢安全“防护... (来源:廊坊日报)转自:廊坊日报 本报讯(记者 曹明明)近日,霸州市煎茶铺镇第一小学组织开展...
港股科技ETF国泰(51302... 4月8日,国泰中证港股通科技ETF(513020)收盘涨4.71%,成交额3.15亿元。港股科技ET...
信息安全ETF嘉实(15961... 4月8日,嘉实中证信息安全主题ETF(159613)收盘涨6.72%,成交额450.41万元。信息安...
港股互联网ETF华宝(5137... 4月8日,华宝中证港股通互联网ETF(513770)收盘涨6.30%,成交额10.05亿元。港股互联...
寒武纪股价连续3天上涨累计涨幅... 4月8日,寒武纪涨4.02%,截至发稿,报1164.00元/股,成交121.36亿元,换手率2.51...