jmrf說的那個技術之測試

c
chebyshev
楼主 (未名空间)

jmrf給的這個文獻的裡的辦法,
我測試了下。有用。

程序就是簡單的純燒CPU求內積。gcc不加任何flag。
不然很多東西會優化掉。

我拆開成8個。測試結果提高了7%。(1.4秒變成1.3秒)
當然,這個辦法可能被別的優化開關覆蓋掉。
如果優化開關開的多,提高不一定那麼多。

但是此測試表明,排除其他因素之後,此技術有用。https://blog.theincredibleholk.org/blog/2012/12/10/optimizing-dot-product/