Format de coma flotant Bfloat16

El format de coma flotant bfloat16 (brain floating point)^[1]^[2] és un format de nombres informàtics que ocupa 16 bits a la memòria de l'ordinador; representa un ampli rang dinàmic de valors numèrics mitjançant un punt de base flotant. Aquest format és una versió escurçada (16 bits) del format de coma flotant de simple precisió IEEE 754 de 32 bits (binary32) amb la intenció d'accelerar l'aprenentatge automàtic i la computació de sensors propers.^[3] Preserva el rang dinàmic aproximat dels nombres de coma flotant de 32 bits mantenint 8 bits d'exponent, però només admet una precisió de 8 bits en lloc del significand de 24 bits del format binary32. Més que els nombres de coma flotant de 32 bits de precisió simple, els nombres bfloat16 no són adequats per a càlculs d'enters, però aquest no és el seu ús previst. Bfloat16 s'utilitza per reduir els requisits d'emmagatzematge i augmentar la velocitat de càlcul dels algoritmes d'aprenentatge automàtic.^[4]

El format bfloat16 va ser desenvolupat per Google Brain, un grup de recerca en intel·ligència artificial de Google. S'utilitza en moltes CPU, GPU i processadors d'IA, com ara els processadors Intel Xeon (extensions AVX-512 BF16), la GPU Intel Data Center, l'Intel Nervana NNP-L1000, les FPGA d'Intel,^[5]^[6]^[7] AMD Zen, AMD Instinct, les GPU NVIDIA, les TPU de Google Cloud,^[8]^[9]^[10] AWS Inferentia, AWS Trainium, ARMv8.6-A,^[11] i els xips M2^[12] i, per tant, A15 d'Apple i posteriors. Moltes biblioteques admeten bfloat16, com ara CUDA,^[13] Intel oneAPI Math Kernel Library, AMD ROCM,^[14] AMD Optimizing CPU Libraries, PyTorch i TensorFlow.^[10] En aquestes plataformes, bfloat16 també es pot utilitzar en aritmètica de precisió mixta, on es pot operar amb els nombres bfloat16 i expandir-los a tipus de dades més amplis.

Format de coma flotant bfloat16

bfloat16 té el format següent:

Bit de signe: 1 bit
Amplada de l'exponent: 8 bits
Precisió significativa: 8 bits (7 emmagatzemats explícitament, amb un bit inicial implícit), en contraposició als 24 bits d'un format clàssic de coma flotant de precisió simple

El format bfloat16, que és un nombre float de 32 bits de precisió simple IEEE 754 abreujat, permet una conversió ràpida des de i cap a un nombre float de 32 bits de precisió simple IEEE 754; en la conversió al format bfloat16, els bits d'exponent es conserven mentre que el camp significand es pot reduir mitjançant truncament (corresponent així a l'arrodoniment cap a 0) o altres mecanismes d'arrodoniment, ignorant el cas especial de NaN. Preservar els bits d'exponent manté el rang del nombre flotant de 32 bits de ≈ 10⁻³⁸ a ≈ 3 × 10^38.^[15]

Els bits estan disposats de la següent manera:

IEEE half-precision 16-bit float

sign

exponent (5 bit)

fraction (10 bit)

┃

0

1

0

1

0

15

14

10

9

0

bfloat16

sign

exponent (8 bit)

fraction (7 bit)

┃

0

1

0

1

0

15

14

7

6

0

Nvidia's TensorFloat-32 (19 bits)

sign

exponent (8 bit)

fraction (10 bit)

┃

0

1

0

1

0

18

17

10

9

0

AMD's fp24 format

sign

exponent (7 bit)

fraction (16 bit)

┃

0

1

0

1

0

23

22

16

15

0

Pixar's PXR24 format

sign

exponent (8 bit)

fraction (15 bit)

┃

0

1

0

1

0

23

22

15

14

0

IEEE 754 single-precision 32-bit float

sign

exponent (8 bit)

fraction (23 bit)

┃

0

1

0

1

0

31

30

23

22

0

Codificació d'exponents

L'exponent de coma flotant binari bfloat16 es codifica mitjançant una representació offset-binary, amb el offset zero de 127; també conegut com a biaix d'exponent a l'estàndard IEEE 754.

E _mín = 01 _H −7F _H = −126
E _màx = FE _H −7F _H = 127
Biaix d'exponent = 7F _H = 127

Per tant, per obtenir l'exponent real tal com es defineix per la representació offset-binary, cal restar el desplaçament de 127 del valor del camp d'exponent.

Els valors mínim i màxim del camp d'exponent (00 _H i FF _H) s'interpreten de manera especial, com en els formats estàndard IEEE 754.

El valor normal positiu mínim és 2⁻¹²⁶ ≈ 1,18 × 10⁻³⁸ i el valor positiu mínim (subnormal) és 2⁻¹²⁶⁻⁷ = 2⁻¹³³ ≈ 9,2 × 10⁻⁴¹.

Exponent	Significant zero	Significant diferent de zero	Equació
00 _H	zero, −0	nombres subnormals	(−1) ^{bit de signe} ×2 ⁻¹²⁶ × 0 bits de significació
01 _H,... , FE _H	valor normalitzat		(−1) ^{bit de signe} ×2 ^{bits d'exponent−127} × 1 bits de significació
FF _H	± infinit	NaN (silenciós, senyalització)

Exemples

Aquests exemples es donen en representació de bits, en hexadecimal i binari, del valor de coma flotant. Això inclou el signe, l'exponent (biaixat) i el significand.

3f80 = 0 01111111 0000000 = 1

c000 = 1 10000000 0000000 = −2

7f7f = 0 11111110 1111111 = (2⁸ − 1) × 2⁻⁷ × 2¹²⁷ ≈ 3,38953139 × 10³⁸ (valor positiu finit màxim en precisió bfloat16) 0080 = 0 00000001 0000000 = 2⁻¹²⁶ ≈ 1.175494351 × 10⁻³⁸ (valor positiu mínim normalitzat en bfloat16 de precisió i coma flotant de precisió simple)

El valor finit positiu màxim d'un nombre bfloat16 normal és 3,38953139 × 10^³⁸, lleugerament per sota de (2^{^24} − 1) × 2⁻²³ × 2^¹²⁷ = 3,402823466 × 10^³⁸, el valor finit positiu màxim representable en simple precisió.

Referències

↑ Teich, Paul. «Tearing Apart Google's TPU 3.0 AI Coprocessor» (en anglès). The Next Platform, 10-05-2018. [Consulta: 11 agost 2020].
↑ Wang, Shibo. «BFloat16: The secret to high performance on Cloud TPUs» (en anglès). Google Cloud, 23-08-2019. [Consulta: 11 agost 2020].
↑ Tagliavini, Giuseppe. «A transprecision floating-point platform for ultra-low power computing». A: 2018 Design, Automation & Test in Europe Conference & Exhibition (DATE) (en anglès), 2018, p. 1051–1056. DOI 10.23919/DATE.2018.8342167. ISBN 978-3-9819263-0-9.
↑ Dr. Ian Cutress. «Intel': Cooper lake Plans: Why is BF16 Important?» (en anglès), 17-03-2020. [Consulta: 12 maig 2020].
↑ Khari Johnson. «Intel unveils Nervana Neural Net L-1000 for accelerated AI training» (en anglès). VentureBeat, 23-05-2018. [Consulta: 23 maig 2018].
↑ Michael Feldman. «Intel Lays Out New Roadmap for AI Portfolio» (en anglès). TOP500 Supercomputer Sites, 23-05-2018. [Consulta: 23 maig 2018].
↑ Lucian Armasu. «Intel To Launch Spring Crest, Its First Neural Network Processor, In 2019» (en anglès). Tom's Hardware, 23-05-2018. [Consulta: 23 maig 2018].
↑ «Available TensorFlow Ops | Cloud TPU | Google Cloud» (en anglès). Google Cloud. [Consulta: 23 maig 2018].
↑ Elmar Haußmann. «Comparing Google's TPUv2 against Nvidia's V100 on ResNet-50» (en anglès). RiseML Blog, 26-04-2018. Arxivat de l'original el 2018-04-26. [Consulta: 23 maig 2018].
↑ ^10,0 ^10,1 Tensorflow Authors. «ResNet-50 using BFloat16 on TPU» (en anglès). Google, 23-07-2018. [Consulta: 6 novembre 2018].
↑ «BFloat16 extensions for Armv8-A» (en anglès). community.arm.com, 29-08-2019. [Consulta: 30 agost 2019].
↑ «AArch64: add support for newer Apple CPUs · llvm/llvm-project@677da09» (en anglès). GitHub. [Consulta: 8 maig 2023].
↑ «CUDA Library bloat16 Intrinsics» (en anglès).
↑ «ROCm version history» (en anglès). github.com. [Consulta: 23 octubre 2019].
↑ «Livestream Day 1: Stage 8 (Google I/O '18) - YouTube». Google, 08-05-2018. [Consulta: 23 maig 2018].

[1] Teich, Paul. «Tearing Apart Google's TPU 3.0 AI Coprocessor» (en anglès). The Next Platform, 10-05-2018. [Consulta: 11 agost 2020].

[2] Wang, Shibo. «BFloat16: The secret to high performance on Cloud TPUs» (en anglès). Google Cloud, 23-08-2019. [Consulta: 11 agost 2020].

[3] Tagliavini, Giuseppe. «A transprecision floating-point platform for ultra-low power computing». A: 2018 Design, Automation & Test in Europe Conference & Exhibition (DATE) (en anglès), 2018, p. 1051–1056. DOI 10.23919/DATE.2018.8342167. ISBN 978-3-9819263-0-9.

[Why-4] Dr. Ian Cutress. «Intel': Cooper lake Plans: Why is BF16 Important?» (en anglès), 17-03-2020. [Consulta: 12 maig 2020].

[vent_Inte-5] Khari Johnson. «Intel unveils Nervana Neural Net L-1000 for accelerated AI training» (en anglès). VentureBeat, 23-05-2018. [Consulta: 23 maig 2018].

[top5_Inte-6] Michael Feldman. «Intel Lays Out New Roadmap for AI Portfolio» (en anglès). TOP500 Supercomputer Sites, 23-05-2018. [Consulta: 23 maig 2018].

[toms_Inte-7] Lucian Armasu. «Intel To Launch Spring Crest, Its First Neural Network Processor, In 2019» (en anglès). Tom's Hardware, 23-05-2018. [Consulta: 23 maig 2018].

[clou_Avai-8] «Available TensorFlow Ops | Cloud TPU | Google Cloud» (en anglès). Google Cloud. [Consulta: 23 maig 2018].

[blog_Comp-9] Elmar Haußmann. «Comparing Google's TPUv2 against Nvidia's V100 on ResNet-50» (en anglès). RiseML Blog, 26-04-2018. Arxivat de l'original el 2018-04-26. [Consulta: 23 maig 2018].

[gith_tens-10] 10,0 ^10,1 Tensorflow Authors. «ResNet-50 using BFloat16 on TPU» (en anglès). Google, 23-07-2018. [Consulta: 6 novembre 2018].

[11] «BFloat16 extensions for Armv8-A» (en anglès). community.arm.com, 29-08-2019. [Consulta: 30 agost 2019].

[12] «AArch64: add support for newer Apple CPUs · llvm/llvm-project@677da09» (en anglès). GitHub. [Consulta: 8 maig 2023].

[13] «CUDA Library bloat16 Intrinsics» (en anglès).

[14] «ROCm version history» (en anglès). github.com. [Consulta: 23 octubre 2019].

[googleio18-day1-time2575-15] «Livestream Day 1: Stage 8 (Google I/O '18) - YouTube». Google, 08-05-2018. [Consulta: 23 maig 2018].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]