编程语言Javascript代码是如何被压缩的

    作者:佚名更新于: 2020-03-09 20:41:51

    大神带你学编程,欢迎选课

    前端高级进阶:Javascript代码是如何被压缩的.编程语言往往使程序员能够比使用机器语言更准确地表达他们所想表达的目的。对那些从事计算机科学的人来说,懂得程序设计语言是十分重要的,因为在当今所有的计算都需要程序设计语言才能完成。

    随着前端的发展,特别是 React,Vue 等构造单页应用的兴起,前端的能力得以很大提升,随之而来的是项目的复杂度越来越大。此时的前端的静态资源也越来越庞大,而毫无疑问 javascript 资源已是前端的主体资源,对于压缩它的体积至为重要。

    为什么说更小的体积很重要呢:更小的体积对于用户体验来说意味着更快的加载速度以及更好的用户体验,这也能早就企业更大的利润。另外,更小的体积对于服务器来说也意味更小的带宽以及更少的服务器费用。

    前端构建编译代码时,可以使用 webpack 中的 optimization.minimizer 来对代码进行压缩优化。但是我们也需要了解如何它是压缩代码的,这样当在生产环境的控制台调试代码时对它也有更深刻的理解。

    如何查看资源的体积

    对于我们所编写的代码,它在操作系统中是一个文件,根据文件系统中的 stat 信息我们可以查看该文件的大小。

    stat 命令用来打印文件系统的信息:

    1. $ stat config.js  
    2.   File: ‘config.js’  
    3.   Size: 3663            Blocks: 8          IO Block: 4096   regular file  
    4. Device: fd01h/64769d    Inode: 806060      Links: 1  
    5. Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root)  
    6. Access: 2020-02-13 13:43:54.851381702 +0800  
    7. Modify: 2020-02-13 13:43:52.668417641 +0800  
    8. Change: 2020-02-13 13:43:52.691417262 +0800  
    9.  Birth: - 

    stat 打印的信息过大,如果只用来衡量体积,可以使用 wc -c 。

    1. $ wc -c config.js  
    2. 3663 config.js 

    如何压缩代码体积?

    去除多余字符: 空格,换行及注释

    1. // 对两个数求和  
    2. function sum (a, b) {  
    3.   return a + b;  

    先把一个抽象的问题给具体化,如果是以上一段代码,那如何压缩它的体积呢:

    此时文件大小是 62 Byte, 一般来说中文会占用更大的空间。

    多余的空白字符会占用大量的体积,如空格,换行符,另外注释也会占用文件体积。当我们把所有的空白符合注释都去掉之后,代码体积会得到减少。

    去掉多余字符之后,文件大小已经变为 30 Byte。 压缩后代码如下:

    1. function sum(a,b){return a+b} 

    替换掉多余字符后会有什么问题产生呢?

    有,比如多行代码压缩到一行时要注意行尾分号。 这就需要通过以下介绍的 AST 来解决。

    压缩变量名:变量名,函数名及属性名

    1. function sum (first, second) {  
    2.   return first + second;  

    如以上 first 与 second 在函数的作用域中,在作用域外不会引用它,此时可以让它们的变量名称更短。但是如果这是一个 module 中,sum 这个函数也不会被导出呢?那可以把这个函数名也缩短。

    1. // 压缩: 缩短变量名  
    2. function sum (x, y) {  
    3.   return x + y;  
    4. }  
    5. // 再压缩: 去除空余字符  
    6. function s(x,y){return a+b} 

    在这个示例中,当完成代码压缩 (compress) 时,代码的混淆 (mangle) 也捎带完成。但此时缩短变量的命名也需要 AST 支持,不至于在作用域中造成命名冲突。

    更简单的表达:合并声明以及布尔值简化

    合并声明的示例如下:

    1. // 压缩前  
    2. const a = 3;  
    3. const b = 4;  
    4. // 压缩后  
    5. const a = 3b = 4

    布尔值简化的示例如下:

    1. // 压缩前  
    2. !b && !c && !d && !e  
    3. // 压缩后  
    4. b||c||d||e 

    这个示例更是需要解析 AST 了。

    AST

    AST,抽象语法树,js 代码解析后的最小词法单元,而这个过程就是通过 Parser 来完成的。

    那么 AST 可以做什么呢?

    •  eslint: 校验你的代码风格
    •  babel: 编译代码到 ES 低版本
    •  taro/mpvue: 各种可以多端运行的小程序框架
    •  GraphQL: 解析客户端查询

    我们在日常工作中经常会不经意间与它打交道,如 eslint 与 babel,都会涉及到 js 与代码中游走。不同的解析器会生成不同的 AST,司空见惯的是 babel 使用的解析器 babylon,而 uglify 在代码压缩中使用到的解析器是 UglifyJS。

    你可以在 AST Explorer[3] 中直观感受到,如下图:

    编程语言Javascript代码是如何被压缩的_编程语言_ Javascript_操作系统_课课家

    那压缩代码的过程:code -> AST -> (transform)一颗更小的 AST -> code,这与 babel 和 eslint 的流程一模一样。

    UglifyJS

    不要重复造轮子!

    于是我找了一个久负盛名的关于代码压缩的库: UglifyJS3[4],一个用以代码压缩混淆的库。那它是如何完成一些压缩功能的,比如替换空白符,答案是 AST。

    webpack 中内置的代码压缩插件就是使用了它,它的工作流程大致如下:

    1. // 原始代码  
    2. const code = `const a = 3;`  
    3. // 通过 UglifyJS 把代码解析为 AST  
    4. const ast = UglifyJS.parse(code);  
    5. ast.figure_out_scope();  
    6. // 转化为一颗更小的 AST 树  
    7. compressor = UglifyJS.Compressor();  
    8. astast = ast.transform(compressor);  
    9. // 再把 AST 转化为代码  
    10. code = ast.print_to_string(); 

    而当你真正使用它来压缩代码时,你只需要面向配置编程即可,文档参考 uglify 官方文档[5] 。

    1. {  
    2.   {  
    3.     ecma: 8,  
    4.   },  
    5.   compress: {  
    6.     ecma: 5,  
    7.     warnings: false,  
    8.     comparisons: false,  
    9.     inline: 2,  
    10.   },  
    11.   output: {  
    12.     ecma: 5,  
    13.     comments: false,  
    14.     ascii_only: true,  
    15.   }  

    在 webpack 中压缩代码

    在知道代码压缩是怎么完成的之后,我们终于可以把它搬到生产环境中去压缩代码。终于到了实践的时候了,虽然它只是简单的调用 API 并且调调参数。

    一切与性能优化相关的都可以在 optimization 中找到,TerserPlugin 是一个底层基于 uglifyjs 的用来压缩 JS 的插件。

    1. optimization: {  
    2.   minimize: isEnvProduction,  
    3.   minimizer: [  
    4.     new TerserPlugin({  
    5.       terserOptions: {  
    6.         parse: {  
    7.           ecma: 8,  
    8.         },  
    9.         compress: {  
    10.           ecma: 5,  
    11.           warnings: false, 
    12.  
    13.           comparisons: false,  
    14.           inline: 2,  
    15.         },  
    16.         output: {  
    17.           ecma: 5,  
    18.           comments: false,  
    19.           ascii_only: true,  
    20.         },  
    21.       },  
    22.       sourceMap: true  
    23.     })  
    24.   ]  
    25. }  
      编程语言原本是被设计成专门使用在计算机上的,但它们也可以用来定义算法或者数据结构。正是因为如此,程序员才会试图使程序代码更容易阅读。

课课家教育

未登录