好看的言情小说,我欲封天txt下载,豆豆小说阅读网

取整求個無符號整數的平均值，居然也能整出花兒來？

這不，微軟大神Raymond Chen最近的一篇長文直接引爆外網技術平臺，引發無數討論：

無數人點進去時無比自信：不就是一個簡單的相加后除二的小學生編程題嗎？

unsignedaverage(unsigneda,unsignedb)
{
return(a+b)/2;
}

但跟著大神的一路深挖，卻逐漸目瞪狗呆……

沒那么簡單的求平均值

先從開頭提到的小學生都會的方法看起，這個簡單的方法有個致命的缺陷：

如果無符號整數的長度為32位，那么如果兩個相加的值都為最大長度的一半，那么僅在第一步相加時，就會發生內存溢出。

也就是average（0x80000000U, 0x80000000U）=0。

不過解決方法也不少，大多數有經驗的開發者首先能想到的，就是預先限制相加的數字長度，避免溢出。

具體有兩種方法：

1、當知道相加的兩個無符號整數中的較大值時，減去較小值再除二，以提前減少長度：

unsignedaverage(unsignedlow,unsignedhigh)
{
returnlow+(high-low)/2;
}

2、對兩個無符號整數預先進行除法，同時通過按位與修正低位數字，保證在兩個整數都為奇數時，結果仍然正確。

（順帶一提，這是一個被申請了專利的方法，2016年過期）

unsignedaverage(unsigneda,unsignedb)
{
return(a/2)+(b/2)+(a&b&1);
}

這兩個都是較為常見的思路，不少網友也表示，自己最快想到的就是2016年專利方法。

同樣能被廣大網友快速想到的方法還有SWAR（SIMD within a register）：

unsignedaverage(unsigneda,unsignedb)
{
return(a&b)+(a^b)/2;//變體(a^b)+(a&b)*2

以及C++ 20版本中的std: : midpoint函數。

接下來，作者提出了第二種思路：

如果無符號整數是32位而本機寄存器大小是64位，或者編譯器支持多字運算，就可以將相加值強制轉化為長整型數據。

unsignedaverage(unsigneda,unsignedb)
{
//Suppose"unsigned"isa32-bittypeand
//"unsignedlonglong"isa64-bittype.
return((unsignedlonglong)a+b)/2;
}

不過，這里有一個需要特別注意的點：

必須要保證64位寄存器的前32位都為0，才不會影響剩余的32位值。

像是x86-64和aarch64這些架構會自動將32位值零擴展為64位值：

//x86-64:Assumeecx=a,edx=b,upper32bitsunknown
moveax,ecx;rax=ecxzero-extendedto64-bitvalue
movedx,edx;rdx=edxzero-extendedto64-bitvalue
addrax,rdx;64-bitaddition:rax=rax+rdx
shrrax,1;64-bitshift:rax=rax>>1
;resultiszero-extended
;Answerineax

//AArch64(ARM64-bit):Assumew0=a,w1=b,upper32bitsunknown
uxtwx0,w0;x0=w0zero-extendedto64-bitvalue
uxtwx1,w1;x1=w1zero-extendedto64-bitvalue
addx0,x1;64-bitaddition:x0=x0+x1
ubfxx0,x0,1,32;Extractbits1through32fromresult
;(shift+zero-extendinoneinstruction)
;Answerinx0

而Alpha AXP、mips64等架構則會將32位值符號擴展為64位值。

這種時候，就需要額外增加歸零的指令，比如通過向左進位兩字的刪除指令rldicl：

//AlphaAXP:Assumea0=a,a1=b,bothincanonicalform
inslla0,#0,a0;a0=a0zero-extendedto64-bitvalue
inslla1,#0,a1;a1=a1zero-extendedto64-bitvalue
addqa0,a1,v0;64-bitaddition:v0=a0+a1
srlv0,#1,v0;64-bitshift:v0=v0>>1
addlzero,v0,v0;Forcecanonicalform
;Answerinv0

//MIPS64:Assumea0=a,a1=b,sign-extended
dexta0,a0,0,32;Zero-extenda0to64-bitvalue
dexta1,a1,0,32;Zero-extenda1to64-bitvalue
dadduv0,a0,a1;64-bitaddition:v0=a0+a1
dsrlv0,v0,#1;64-bitshift:v0=v0>>1
sllv0,#0,v0;Sign-extendresult
;Answerinv0

//Power64:Assumer3=a,r4=b,zero-extended
addr3,r3,r4;64-bitaddition:r3=r3+r4
rldiclr3,r3,63,32;Extractbits63through32fromresult
;(shift+zero-extendinoneinstruction)
;resultinr3

或者直接訪問比本機寄存器更大的SIMD寄存器，當然，從通用寄存器跨越到SIMD寄存器肯定也會增加內存消耗。

如果電腦的處理器支持進位加法，那么還可以采用第三種思路。

這時，如果寄存器大小為n位，那么兩個n位的無符號整數的和就可以理解為n+1位，通過RCR（帶進位循環右移）指令，就可以得到正確的平均值，且不損失溢出的位。

△帶進位循環右移

//x86-32
moveax,a
addeax,b;Add,overflowgoesintocarrybit
rcreax,1;Rotaterightoneplacethroughcarry

//x86-64
movrax,a
addrax,b;Add,overflowgoesintocarrybit
rcrrax,1;Rotaterightoneplacethroughcarry

//32-bitARM(A32)
movr0,a
addsr0,b;Add,overflowgoesintocarrybit
rrxr0;Rotaterightoneplacethroughcarry

//SH-3
clrt;ClearTflag
mova,r0
addcb,r0;r0=r0+b+T,overflowgoesintoTbit
rotcrr0;Rotaterightoneplacethroughcarry

那如果處理器不支持帶進位循環右移操作呢？

也可以使用內循環（rotation intrinsic）：

unsignedaverage(unsigneda,unsignedb)
{
#ifdefined(_MSC_VER)
unsignedsum;
autocarry=_addcarry_u32(0,a,b,&sum);
sum=(sum&~1)|carry;
return_rotr(sum,1);
#elifdefined(__clang__)
unsignedcarry;
sum=(sum&~1)|carry;
autosum=__builtin_addc(a,b,0,&carry);
return__builtin_rotateright32(sum,1);
#else
#errorUnsupportedcompiler.
#endif
}

結果是，x86架構下的代碼生成沒有發生什么變化，MSCver架構下的代碼生成變得更糟，而arm-thumb2的clang 的代碼生成更好了。

//_MSC_VER
movecx,a
addecx,b;Add,overflowgoesintocarrybit
setcal;al=1ifcarryset
andecx,-2;Clearbottombit
movzxecx,al;Zero-extendbyteto32-bitvalue
oreax,ecx;Combine
rorear,1;Rotaterightoneposition
;Resultineax

//__clang__
movecx,a
addecx,b;Add,overflowgoesintocarrybit
setcal;al=1ifcarryset
shldeax,ecx,31;Shiftleft64-bitvalue

//__clang__withARM-Thumb2
movsr2,#0;Preparetoreceivecarry
addsr0,r0,r1;Calculatesumwithflags
adcsr2,r2;r2holdscarry
lsrsr0,r0,#1;Shiftsumrightoneposition
lslsr1,r2,#31;Movecarrytobit31
addsr0,r1,r0;Combine

微軟大神的思考們

Raymond Chen1992年加入微軟，迄今為止已任職25年，做UEX-Shell，也參與Windows開發，Windows系統的很多最初UI架構就是他搞起來的。

他在MSDN 上建立的blogThe Old New Thing也是業內非常出名的純技術向產出網站。

這篇博客的評論區們也是微軟的各路大神出沒，繼續深入探討。

有人提出了新方法，在MIPS ASM共有36個循環：

unsignedavg(unsigneda,unsignedb)
{
return(a&b)+(a^b)/2;
}

//lw$3,8($fp)#5
//lw$2,12($fp)#5
//and$3,$3,$2#4
//lw$4,8($fp)#5
//lw$2,12($fp)#5
//xor$2,$4,$2#4
//srl$2,$2,1#4
//addu$2,$3,$2#4

有人針對2016年專利法表示，與其用(a / 2) + (b / 2) + (a & b & 1)的方法，為啥不直接把 (a & 1) & ( b & 1 ) ) 作為進位放入加法器中計算呢？

還有人在評論區推薦了TopSpeed編譯器，能夠通過指定合適的代碼字節和調用約定來定義一個內聯函數，以解決“乘除結果是16位，中間計算值卻不是”的情況。

只能說，學無止境啊。

原文標題：看完微軟大神寫的求平均值代碼，我意識到自己還是too young了

文章出處：【微信公眾號：算法與數據結構】歡迎添加關注！文章轉載請注明出處。
審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

微軟

微軟

+關注

關注
4

文章
6598

瀏覽量
104071
寄存器

寄存器

+關注

關注
31

文章
5343

瀏覽量
120385
編程

編程

+關注

關注
88

文章
3616

瀏覽量
93739

原文標題：看完微軟大神寫的求平均值代碼，我意識到自己還是too young了

文章出處：【微信號：TheAlgorithm，微信公眾號：算法與數據結構】歡迎添加關注！文章轉載請注明出處。

求解平均值

整數型定義的數據op1:in integer range 0 to 4095;op2:in integer range 0 to 4095;用mid=（op1+op2）/2這樣計算能求得兩數的平均值么？

發表于 06-11 21:29

求平均值,并顯示

采集好的10萬個數據，每次取一千個然后計算這一千個數的平均值，最后將這所有平均值在波形圖中顯示出

發表于 05-24 12:13

求平均值并顯示

采集好的10萬個數據，每次取一千個然后計算這一千個數的平均值，最后將這所有平均值在波形圖中顯示出

發表于 05-24 12:16

連續采樣平均值比較取較小值

平均值取小，繼續比較反復進行，直到前100個點的平均值比后100個點的小為止，由于得到的值得用在該while循環里，故只能在循環里邊采集邊處

發表于 01-13 19:21

數組中的值求平均值

在我的程序中，我得到了幾組數據，求每一個索引所對應數據的平均值

發表于 12-10 09:41

將100個0~100的隨機數取整后構成10*10的二位數組，計算該二維數組的最大值及平均值

labviwe實現將100個0~100的隨機數取整后構成10*10的二位數組，計算該二維數組的最大值及平均值，求大神解答。。。

發表于 05-29 20:45

求ROM中表格中8個無符號數的算術平均值

1、實驗內容一 1.1、問題一：設ROM中的表格TAB中存儲有8個無符號數（小于等于10），求這8個無

發表于 07-14 08:08

平均值采樣法的使用

在上一篇文章單片機ADC采樣算法---平均值采樣法中分析了平均值采樣法的使用，上篇文章中的平均值采樣法是連續采樣100個數據，然后求

發表于 01-11 07:58

ADC取初始平均值的方法

ADC取初始平均值的方法

發表于 02-09 06:49

求雙字節十六進制無符號數據塊的平均值

求雙字節十六進制無符號數據塊的平均值 入口條件：數據塊的首址在DPTR中，雙字節數據總個數在R7中。出口信息：平均值在R4、R5中。影

發表于 01-19 23:03 ?1430次閱讀

求單字節十六進制無符號數據塊的平均值

求單字節十六進制無符號數據塊的平均值 入口條件：數據塊的首址在DPTR中，數據個數在R7中。出口信息：平均值在累加器A中。影響

發表于 01-19 23:03 ?1512次閱讀

什么是平均值? 平均值是什么意思？

什么是平均值? 平均值是什么意思？交變電流的平均值是指在某段時間內流過電路的總電荷與該段時間的比值。正弦量

發表于 04-17 10:31 ?1.1w次閱讀

求2路輸入平均值的運算電路

求2路輸入平均值的運算電路電路功能一提到平均值運算，人們往

發表于 05-08 11:47 ?7979次閱讀

排除最大最小值后求平均值

輸入數據中排除最大最小值后求平均值的算法，測試通過。

發表于 08-18 18:24 ?11次下載

ADC取初始平均值

主要邏輯：取8次平均值，然后存入數組，求和然后取平均值。void AdcAverageInit(void){ u16 ADCInit_SPVal = 0; u8 n; for(n=0; n&

發表于 12-06 10:21 ?6次下載

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

如何取整求個無符號整數的平均值

取整求個無符號整數的平均值，居然也能整出花兒來？

沒那么簡單的求平均值

△帶進位循環右移

微軟大神的思考們

評論

求解平均值

求平均值,并顯示

求平均值并顯示

連續采樣平均值比較取較小值

數組中的值求平均值

將100個0~100的隨機數取整后構成10*10的二位數組，計算該二維數組的最大值及平均值

求ROM中表格中8個無符號數的算術平均值

平均值采樣法的使用

ADC取初始平均值的方法

求雙字節十六進制無符號數據塊的平均值

求單字節十六進制無符號數據塊的平均值

什么是平均值? 平均值是什么意思？

求2路輸入平均值的運算電路

排除最大最小值后求平均值

ADC取初始平均值