Halo

发布于 2024-06-12 / 117 阅读 / 0 评论 / 0 点赞

算力

算力单位

在谈论算力的时候，人们常用“P”计算：

1P=1024T = $10^{12}$
1T=1024G = $10^{9}$
1G=1024M = $10^{6}$
1M=1024k = $10^{3}$
算力单位每秒浮点运算次数FLOPS，根据浮点数的不同，可以分为FP16、FP32单精度和FP64双精度，通常记为xxxFLOPS(FP16)、0.5xxxFLOPS(FP32)、0.25xxxFLOPS(FP64)

单个cpu算力估算

计算公式：算力(FLOPS) = CPU核心数 x 时钟频率 x 单个周期浮点计算能力
单个周期浮点计算能力(FP32) = AVX-512 FMA 单元数 x FMA系数 x 2(同时加法和乘法) / 32 = 512 x FMA系数 x 2 / 32
英特尔® 至强® Gold 6348 处理器，28c，2.60 GHz，42M 高速缓存， TDP 235w:
查询得：单个周期浮点计算能力(FP32) = 512 x 2(FMA系数) x 2(同时加法和乘法) /32 =64
6348 算力(FP32) = 28 x 2.6 x $10^9$ x 64 / $10^{12}$ = 4.6 TFLOPS

算力分类

通用算力（General-Purpose Computing Power）

一般指CPU算力，传统的中央处理单元，适用于广泛的计算任务，包括日常办公、网页浏览、轻量级数据处理等

智能算力（Intelligent Computing Power）

GPU算力，图形处理单元，特别适用于需要大量并行处理的任务，如深度学习、图像和视频处理
TPU算力，张量处理单元，为机器学习任务优化，提供高效的AI计算能力。
AI加速器，如神经网络处理器（NPU）、深度学习加速器等，专门设计用于加速AI算法。

超算算力（Supercomputing Power）

超级计算机，由大量高性能处理器（CPU/GPU/TPU等）组成，用于执行极其复杂的科学计算和大规模数据处理
高性能计算集群（HPC），由多个高性能节点组成的计算集群，通常用于科研、工程设计、气候模拟等
异构计算，结合不同类型的处理器（如CPU、GPU、FPGA、ASIC等）以优化特定计算任务的性能

评论