研究档案提供对ACM通信过去几期发表的所有研究文章的访问。
由于gpu已经成为主流的并行处理引擎,许多针对gpu的应用程序现在具有更适应于传统缓存的数据局部性。“了解你的极限”中描述的体系结构有许多……
本文研究了具有显著局部性的高并行工作负载在大规模多线程GPU上的加速效果。