2024-06-23から1日間の記事一覧
前回の記事(行列乗算の最適化入門 - よーる)では、L3キャッシュに乗りきる程度のサイズ(だいたい1000×1000くらい)の行列積について、シングルスレッドの理論性能の84%以上を出すことができるコードを紹介しました。 4000×4000くらいのもう少し大きな行列…
前回の記事(行列乗算の最適化入門 - よーる)では、L3キャッシュに乗りきる程度のサイズ(だいたい1000×1000くらい)の行列積について、シングルスレッドの理論性能の84%以上を出すことができるコードを紹介しました。 4000×4000くらいのもう少し大きな行列…