看帖神器
未名空间
追帖动态
头条新闻
每日新帖
最新热帖
新闻存档
热帖存档
文学城
虎扑论坛
未名空间
北美华人网
北美微论坛
看帖神器
登录
← 下载
《看帖神器》官方
iOS App
,体验轻松追帖。
jmrf說的那個技術之測試
查看未名空间今日新帖
最新回复:2021年7月9日 16点0分 PT
共 (1) 楼
返回列表
订阅追帖
只看未读
更多选项
阅读全帖
只看图片
只看视频
查看原帖
c
chebyshev
大约 3 年
楼主 (未名空间)
jmrf給的這個文獻的裡的辦法,
我測試了下。有用。
程序就是簡單的純燒CPU求內積。gcc不加任何flag。
不然很多東西會優化掉。
我拆開成8個。測試結果提高了7%。(1.4秒變成1.3秒)
當然,這個辦法可能被別的優化開關覆蓋掉。
如果優化開關開的多,提高不一定那麼多。
但是此測試表明,排除其他因素之後,此技術有用。
https://blog.theincredibleholk.org/blog/2012/12/10/optimizing-dot-product/
请输入帖子链接
收藏帖子
jmrf給的這個文獻的裡的辦法,
我測試了下。有用。
程序就是簡單的純燒CPU求內積。gcc不加任何flag。
不然很多東西會優化掉。
我拆開成8個。測試結果提高了7%。(1.4秒變成1.3秒)
當然,這個辦法可能被別的優化開關覆蓋掉。
如果優化開關開的多,提高不一定那麼多。
但是此測試表明,排除其他因素之後,此技術有用。https://blog.theincredibleholk.org/blog/2012/12/10/optimizing-dot-product/