我好像掌握了特别的常数优化技巧...
实测效果优秀,将 floj#1141 容斥版代码用时减少约 (1000ms)
// 0x0041e203 <+723>: imul -0x8(%eax),%ebx
// 0x0041e207 <+727>: add %ebx,%ebp
// 0x0041e209 <+729>: mov -0xc(%edx),%ebx
// 0x0041e20c <+732>: imul -0xc(%eax),%ebx
// 0x0041e210 <+736>: add %ebx,%ebp
// 0x0041e212 <+738>: mov -0x4(%edx),%ebx
// 0x0041e215 <+741>: imul -0x4(%eax),%ebx
// 0x0041e219 <+745>: add %ebp,%ebx
// 0x0041e21b <+747>: add %ebx,%ecx
// 0x0041e21d <+749>: cmp %eax,%esi
// 0x0041e21f <+751>: jae 0x41e190 <Concurrent::concurrentSolve()+608>
转载于:.html
本文发布于:2024-02-05 02:33:46,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170722032762225.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |