摘要:Gauss-Seidel算法作為線性方程組的求解器,在并行計算領(lǐng)域具有廣泛應(yīng)用,而面向異構(gòu)眾核架構(gòu)開發(fā)其細粒度并行性一直是具有挑戰(zhàn)性的問題.針對非結(jié)構(gòu)網(wǎng)格問題,基于代數(shù)分塊并行思路提出了面向異構(gòu)眾核架構(gòu)的塊Gauss-Seidel/Jacobi算法,將其作為區(qū)域分解算法的子區(qū)域求解器.面向神威太湖之光超級計算機的異構(gòu)眾核架構(gòu),設(shè)計并實現(xiàn)了該算法.為充分利用神威太湖之光國產(chǎn)SW26010芯片中每個CPE擁有的高速LDM(Local Data Memory),緩解通信瓶頸,設(shè)計了多行塊通信打包、計算與通信重疊性能優(yōu)化策略和丟棄非關(guān)鍵元素的低通信復(fù)雜性數(shù)值優(yōu)化方法.數(shù)值實驗結(jié)果顯示,相較于串行Gauss-Seidel算法,優(yōu)化后的塊Gauss-Seidel/Jacobi算法預(yù)處理過程加速比最高可達到4.16倍.以1040核的測試數(shù)據(jù)為基準,在處理器核數(shù)達到33280時,塊Gauss-Seidel/Jacobi預(yù)條件算法的并行效率達到61%.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社