Dying ReLU and Initialization: Theory and Numerical Examples

Journal Home
Volume 36 - 2024
- Vol. 36, Issue 5 pp.1157-1439
- Vol. 36, Issue 4 pp.877-1155
- Vol. 36, Issue 3 pp.581-876
- Vol. 36, Issue 2 pp.319-580
- Vol. 36, Issue 1 pp.1-318
Volume 35 - 2024
- Vol. 35, Issue 5 pp.1155-1444
- Vol. 35, Issue 4 pp.859-1154
- Vol. 35, Issue 3 pp.553-858
- Vol. 35, Issue 2 pp.273-552
- Vol. 35, Issue 1 pp.1-272
Volume 34 - 2023
- Vol. 34, Issue 5 pp.1177-1438
- Vol. 34, Issue 4 pp.869-1176
- Vol. 34, Issue 3 pp.563-868
- Vol. 34, Issue 2 pp.261-562
- Vol. 34, Issue 1 pp.1-260
Volume 33 - 2023
- Vol. 33, Issue 5 pp.1217-1513
- Vol. 33, Issue 4 pp.937-1216
- Vol. 33, Issue 3 pp.647-936
- Vol. 33, Issue 2 pp.367-646
- Vol. 33, Issue 1 pp.1-366
Volume 32 - 2022
- Vol. 32, Issue 5 pp.1217-1509
- Vol. 32, Issue 4 pp.899-1216
- Vol. 32, Issue 3 pp.595-898
- Vol. 32, Issue 2 pp.299-594
- Vol. 32, Issue 1 pp.1-298
Volume 31 - 2022
- Vol. 31, Issue 5 pp.1317-1635
- Vol. 31, Issue 4 pp.997-1316
- Vol. 31, Issue 3 pp.669-996
- Vol. 31, Issue 2 pp.331-668
- Vol. 31, Issue 1 pp.1-330
Volume 30 - 2021
- Vol. 30, Issue 5 pp.1269-1588
- Vol. 30, Issue 4 pp.959-1268
- Vol. 30, Issue 3 pp.635-958
- Vol. 30, Issue 2 pp.321-634
- Vol. 30, Issue 1 pp.1-320
Volume 29 - 2021
- Vol. 29, Issue 5 pp.1299-1622
- Vol. 29, Issue 4 pp.979-1298
- Vol. 29, Issue 3 pp.649-978
- Vol. 29, Issue 2 pp.319-648
- Vol. 29, Issue 1 pp.1-318
Volume 28 - 2020
- Vol. 28, Issue 5 pp.1639-2205
- Vol. 28, Issue 4 pp.1245-1638
- Vol. 28, Issue 3 pp.877-1244
- Vol. 28, Issue 2 pp.539-876
- Vol. 28, Issue 1 pp.1-538
Volume 27 - 2020
- Vol. 27, Issue 5 pp.1275-1589
- Vol. 27, Issue 4 pp.949-1274
- Vol. 27, Issue 3 pp.639-948
- Vol. 27, Issue 2 pp.321-638
- Vol. 27, Issue 1 pp.1-320
Volume 26 - 2019
- Vol. 26, Issue 5 pp.1249-1630
- Vol. 26, Issue 4 pp.947-1248
- Vol. 26, Issue 3 pp.631-946
- Vol. 26, Issue 2 pp.311-630
- Vol. 26, Issue 1 pp.1-310
Volume 25 - 2019
- Vol. 25, Issue 5 pp.1259-1612
- Vol. 25, Issue 4 pp.947-1258
- Vol. 25, Issue 3 pp.625-946
- Vol. 25, Issue 2 pp.311-624
- Vol. 25, Issue 1 pp.1-310
Volume 24 - 2018
- Vol. 24, Issue 5 pp.1279-1578
- Vol. 24, Issue 4 pp.899-1278
- Vol. 24, Issue 3 pp.593-898
- Vol. 24, Issue 2 pp.309-592
- Vol. 24, Issue 1 pp.1-308
Volume 23 - 2018
- Vol. 23, Issue 5 pp.1289-1625
- Vol. 23, Issue 4 pp.899-1288
- Vol. 23, Issue 3 pp.629-898
- Vol. 23, Issue 2 pp.315-628
- Vol. 23, Issue 1 pp.1-314
Volume 22 - 2017
- Vol. 22, Issue 5 pp.1175-1532
- Vol. 22, Issue 4 pp.889-1174
- Vol. 22, Issue 3 pp.599-888
- Vol. 22, Issue 2 pp.303-598
- Vol. 22, Issue 1 pp.1-302
Volume 21 - 2017
- Vol. 21, Issue 5 pp.1207-1488
- Vol. 21, Issue 4 pp.905-1206
- Vol. 21, Issue 3 pp.623-904
- Vol. 21, Issue 2 pp.313-622
- Vol. 21, Issue 1 pp.1-312
Volume 20 - 2016
- Vol. 20, Issue 5 pp.1127-1465
- Vol. 20, Issue 4 pp.835-1126
- Vol. 20, Issue 3 pp.551-834
- Vol. 20, Issue 2 pp.279-550
- Vol. 20, Issue 1 pp.1-278
Volume 19 - 2016
- Vol. 19, Issue 5 pp.1111-1563
- Vol. 19, Issue 4 pp.841-1110
- Vol. 19, Issue 3 pp.559-840
- Vol. 19, Issue 2 pp.273-558
- Vol. 19, Issue 1 pp.1-272
Volume 18 - 2015
- Vol. 18, Issue 5 pp.1211-1503
- Vol. 18, Issue 4 pp.831-1210
- Vol. 18, Issue 3 pp.529-830
- Vol. 18, Issue 2 pp.263-528
- Vol. 18, Issue 1 pp.1-262
Volume 17 - 2015
- Vol. 17, Issue 5 pp.1113-1387
- Vol. 17, Issue 4 pp.887-1112
- Vol. 17, Issue 3 pp.615-886
- Vol. 17, Issue 2 pp.317-614
- Vol. 17, Issue 1 pp.1-316
Volume 16 - 2014
- Vol. 16, Issue 5 pp.1135-1421
- Vol. 16, Issue 4 pp.841-1134
- Vol. 16, Issue 3 pp.571-840
- Vol. 16, Issue 2 pp.287-570
- Vol. 16, Issue 1 pp.1-286
Volume 15 - 2014
- Vol. 15, Issue 5 pp.1237-1503
- Vol. 15, Issue 4 pp.853-1236
- Vol. 15, Issue 3 pp.569-852
- Vol. 15, Issue 2 pp.285-568
- Vol. 15, Issue 1 pp.1-284
Volume 14 - 2013
- Vol. 14, Issue 5 pp.1147-1425
- Vol. 14, Issue 4 pp.851-1146
- Vol. 14, Issue 3 pp.537-850
- Vol. 14, Issue 2 pp.265-536
- Vol. 14, Issue 1 pp.1-264
Volume 13 - 2013
- Vol. 13, Issue 5 pp.1189-1454
- Vol. 13, Issue 4 pp.929-1188
- Vol. 13, Issue 3 pp.603-928
- Vol. 13, Issue 2 pp.325-602
- Vol. 13, Issue 1 pp.1-324
Volume 12 - 2012
- Vol. 12, Issue 5 pp.1293-1625
- Vol. 12, Issue 4 pp.919-1292
- Vol. 12, Issue 3 pp.613-918
- Vol. 12, Issue 2 pp.337-612
- Vol. 12, Issue 1 pp.1-336
Volume 11 - 2012
- Vol. 11, Issue 5 pp.1415-1721
- Vol. 11, Issue 4 pp.1043-1414
- Vol. 11, Issue 3 pp.709-1042
- Vol. 11, Issue 2 pp.271-708
- Vol. 11, Issue 1 pp.1-270
Volume 10 - 2011
- Vol. 10, Issue 5 pp.1089-1365
- Vol. 10, Issue 4 pp.785-1088
- Vol. 10, Issue 3 pp.509-784
- Vol. 10, Issue 2 pp.253-508
- Vol. 10, Issue 1 pp.1-252
Volume 9 - 2011
- Vol. 9, Issue 5 pp.1081-1433
- Vol. 9, Issue 4 pp.843-1080
- Vol. 9, Issue 3 pp.481-842
- Vol. 9, Issue 2 pp.231-480
- Vol. 9, Issue 1 pp.1-230
Volume 8 - 2010
- Vol. 8, Issue 5 pp.947-1274
- Vol. 8, Issue 4 pp.701-946
- Vol. 8, Issue 3 pp.471-700
- Vol. 8, Issue 2 pp.249-470
- Vol. 8, Issue 1 pp.1-248
Volume 7 - 2010
- Vol. 7, Issue 5 pp.877-1132
- Vol. 7, Issue 4 pp.639-876
- Vol. 7, Issue 3 pp.403-638
- Vol. 7, Issue 2 pp.235-402
- Vol. 7, Issue 1 pp.1-234
Volume 6 - 2009
- Vol. 6, Issue 5 pp.919-1165
- Vol. 6, Issue 4 pp.673-918
- Vol. 6, Issue 3 pp.433-672
- Vol. 6, Issue 2 pp.231-432
- Vol. 6, Issue 1 pp.1-230
Volume 5 - 2009
- Vol. 5, Issue 5 pp.849-1055
- Vol. 5, Issue 2-4 pp.195-848
- Vol. 5, Issue 1 pp.1-194
Volume 4 - 2008
- Vol. 4, Issue 5 pp.949-1294
- Vol. 4, Issue 4 pp.729-948
- Vol. 4, Issue 3 pp.433-728
- Vol. 4, Issue 2 pp.207-432
- Vol. 4, Issue 1 pp.1-206
Volume 3 - 2008
- Vol. 3, Issue 5 pp.973-1155
- Vol. 3, Issue 4 pp.759-972
- Vol. 3, Issue 3 pp.519-758
- Vol. 3, Issue 2 pp.271-518
- Vol. 3, Issue 1 pp.1-270
Volume 2 - 2007
- Vol. 2, Issue 6 pp.1055-1245
- Vol. 2, Issue 5 pp.827-1054
- Vol. 2, Issue 4 pp.577-826
- Vol. 2, Issue 3 pp.367-576
- Vol. 2, Issue 2 pp.177-366
- Vol. 2, Issue 1 pp.1-176
Volume 1 - 2006
- Vol. 1, Issue 6 pp.945-1118
- Vol. 1, Issue 5 pp.765-944
- Vol. 1, Issue 4 pp.575-764
- Vol. 1, Issue 3 pp.383-574
- Vol. 1, Issue 2 pp.192-382
- Vol. 1, Issue 1 pp.1-191

Volume 28, Issue 5

Lu Lu, Yeonjong Shin, Yanhui Su & George Em Karniadakis

DOI: 10.4208/cicp.OA-2020-0165

Commun. Comput. Phys., 28 (2020), pp. 1671-1706.

Published online: 2020-11

Preview Purchase PDF 3163 76922

Cited by

google scholar semantic scholar

Export citation

Abstract

The dying ReLU refers to the problem when ReLU neurons become inactive and only output 0 for any input. There are many empirical and heuristic explanations of why ReLU neurons die. However, little is known about its theoretical analysis. In this paper, we rigorously prove that a deep ReLU network will eventually die in probability as the depth goes to infinite. Several methods have been proposed to alleviate the dying ReLU. Perhaps, one of the simplest treatments is to modify the initialization procedure. One common way of initializing weights and biases uses symmetric probability distributions, which suffers from the dying ReLU. We thus propose a new initialization procedure, namely, a randomized asymmetric initialization. We show that the new initialization can effectively prevent the dying ReLU. All parameters required for the new initialization are theoretically designed. Numerical examples are provided to demonstrate the effectiveness of the new initialization procedure.

Keywords

Neural network, Dying ReLU, Vanishing/Exploding gradient, Randomized asymmetric initialization.

AMS Subject Headings

60J05, 62M45, 68U99

Email address

BibTex
RIS
TXT

@Article{CiCP-28-1671, author = {Lu , LuShin , YeonjongSu , Yanhui and Em Karniadakis , George}, title = {Dying ReLU and Initialization: Theory and Numerical Examples}, journal = {Communications in Computational Physics}, year = {2020}, volume = {28}, number = {5}, pages = {1671--1706}, abstract = {

}, issn = {1991-7120}, doi = {https://doi.org/10.4208/cicp.OA-2020-0165}, url = {http://global-sci.org/intro/article_detail/cicp/18393.html} }

TY - JOUR T1 - Dying ReLU and Initialization: Theory and Numerical Examples AU - Lu , Lu AU - Shin , Yeonjong AU - Su , Yanhui AU - Em Karniadakis , George JO - Communications in Computational Physics VL - 5 SP - 1671 EP - 1706 PY - 2020 DA - 2020/11 SN - 28 DO - http://doi.org/10.4208/cicp.OA-2020-0165 UR - https://global-sci.org/intro/article_detail/cicp/18393.html KW - Neural network, Dying ReLU, Vanishing/Exploding gradient, Randomized asymmetric initialization. AB -

Lu , LuShin , YeonjongSu , Yanhui and Em Karniadakis , George. (2020). Dying ReLU and Initialization: Theory and Numerical Examples. Communications in Computational Physics. 28 (5). 1671-1706. doi:10.4208/cicp.OA-2020-0165

Copy to clipboard

BibteX RIS TXT

The citation has been copied to your clipboard

- LOGIN -

- E-mail verification -

- REGISTER -