| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
原始链接: https://news.ycombinator.com/item?id=37874423
作者讨论了ISPC如何允许类似于CUDA的编程,同时避免手动处理向量指令。他们提到,SIMT与传统SIMD的主要问题是处理预测和高效处理重叠计算。尽管现代GPU提供了简化此编程模型的额外硬件支持,但作者指出,传统SIMD和SIMT都需要谨慎关注,以最小化串行化和优化内存访问模式。此外,他们建议探索项目,如llvmpipe,以研究使用它运行OpenCL程序。总之,作者暗示,虽然允许许多独立任务的灵活性是SIMT的优势,但最小化串行化和优化内存访问的基本原理对于实现最佳性能仍然至关重要。
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
It never went anywhere but the code is still online if anyone wants to stare directly at the madness: https://gitlab.com/samsartor/wasm2simt
reply