所在的位置： C++ >> C++市场 >> WebAssembly如何演进成为浏览

WebAssembly如何演进成为浏览

什么是WebAssembly？

WebAssembly或wasm是用于浏览器内客户端脚本的低级、可移植的字节码格式，是一种运行在现代网络浏览器中的新型代码、并且提供新的性能特性和效果，对于浏览器下载和加载是有效的。

它是为诸如C、C++和Rust等低级源语言提供一个高效的编译目标而设计的。

实际上，WebAssembly是由现有JavaScript引擎背后的浏览器开发人员实现的。从本质上讲，它旨在将JavaScript替换为Web上编译器和转换器的目标。例如，不用将TypeScript编译为JavaScript，它的开发人员现在可以编译为WebAssembly。简而言之，它不是一个新的虚拟机，它是每个浏览器中包含的相同JavaScriptVM的新格式。这样就可以在不使用JavaScript的情况下利用现有的JavaScript基础结构。

WebAssembly无疑是近年来让人最为兴奋的新技术之一，它虽始于浏览器但已经开始不断地被各个语言及平台所集成。在实际的工业化落地中，区块链、边缘计算、游戏及图像视频等多个领域都依靠WebAssembly创造了让人称赞的产品。

WebAssembly技术本身具有非常多优点，其中最为被人所熟知的三点有：

二进制格式Low-Level的编译目标接近Native的执行效率那么WebAssembly是从何演变而来，它为什么具有这些优点与特性，又是如何被标准化的，更重要的是作为普通开发者，我们应如何更好地入手WebAssembly开发及实践呢？本专题将围绕WebAssembly及Emscripten工具链，通过一系列文章依次介绍WebAssembly的演变历程、工具链使用、实践案例、最新应用场景及使用技巧，帮助普通开发者正确理解WebAssembly的使用场景，并能够顺利使用Emscripten工具链完成自己的WebAssembly相关项目。

本文作为专题的第一篇文章，将会较为详细地介绍WebAssembly的演变历程，使读者深入理解WebAssembly这门技术的使用场景，从而更好地学习和使用WebAssembly技术。

JavaScript的弊端

JavaScript毫无疑问是技术领域的佼佼者。自BrendanEich于年花费10天时间为Netscape开发出JavaScript为始，到现在已经走过了20多个年头。随着技术的蓬勃发展，不管是NPM与GitHub上丰富的JavaScript库与框架，还是ReactNative、Node.js、Electron、QuickJS等领域技术的出现，无一不彰显着JavaScript生态的繁荣，JavaScript这门语言也变得越来越流行和重要。

但与此同时，随着各类应用功能的复杂化，受限于JavaScript语言本身动态类型和解释执行的设计，其性能问题也逐渐凸现。我们急需新技术帮助我们解决JavaScript的性能问题。在年底，Google、Apple、Mozilla为JavaScript引入了JIT（Just-In-Time）引擎，试图解决JavaScript的性能问题，并取得了非常好的效果。其中的佼佼者非Google的V8莫属，其大举提升了JavaScript的性能，并拉开了JavaScript引擎竞速的序幕。

那JIT（Just-In-Time）引擎是如何提升JavaScript性能的呢？

我们知道，由于JavaScript是解释型语言，因此JavaScript引擎需要逐行将JavaScript代码翻译为可执行的代码。可执行代码有多种形式，其中较为常见的是基于AST的直接执行以及ByteCode的执行方式。显而易见，这些做法相比于直接运行机器码而言都并不高效，如果我们能根据代码的执行频次将部分代码实时编译为机器码，就能获得更大的性能提升。这就是JIT（Just-In-Time）的基本思路。

在实际生产中，JIT（Just-In-Time）引擎一般会引入多层次的决策来优化代码：

warm阶段（解释执行的代码被执行多次）：将解释执行的代码发送给JIT（Just-In-Time）引擎，并创建出编译为机器码的执行代码，但此处并不进行替换；hot阶段（解释执行的代码被执行得十分频繁）：解释执行代码被替换为warm阶段的机器码执行代码；veryhot阶段：将解释执行的代码发送给优化编译器（OptimisingCompiler），创建和编译出更高效的机器码的执行代码并进行替换；假设我们的JavaScript代码中有部分代码被执行了多次，此时这部分代码会被标记为warm，同时被送往JIT（Just-In-Time）引擎进行优化。JIT（Just-In-Time）引擎此时会针对这些代码逐行进行机器码编译，然后存储在一张表的单元中（实际上表单元仅指向了被编译的机器码）。当解释执行的代码被执行得非常频繁时会进入hot阶段，JIT（Just-In-Time）引擎会将解释执行的代码直接替换为编译的机器码版本。

需要注意的是，表单元的引用依据实际上会依赖于行号以及参数类型，假设我们有如下的代码：

functiondoSomething(value){//performingsomeoperations}constarr=[0,String];for(leti=0;iarr.length;i++){doSomething(arr[i])

由于数组arr中存在两种数据类型（Number/String），当我们多次执行相关代码时，

doSomething

函数会被JIT（Just-In-Time）引擎创建并编译出两个不同类型的机器码执行代码版本，并且使用不同的表单元引用。当然，由于机器码执行代码的创建和编译存在代价，因此不同的JIT（Just-In-Time）引擎会有不同的优化策略。

如果部分代码执行得异常频繁，那么自然的这部分解释执行的代码会被发送给优化编译器（OptimisingCompiler）进行更高程度的优化，从而创建并编译出相比warm阶段更高效的机器码执行代码版本。

与此同时，在创建这些高度优化的机器码执行代码期间，编译器将会严格限制执行代码的适用类型（比如仅适用于Number/String或某些特定类型参数），并且在每次调用执行前都会检查参数类型。如果匹配则使用这些高度优化的机器码执行代码，否则将会回退到warm阶段生成的机器码执行代码或是直接解释执行。

JavaScript有了JIT（Just-In-Time）后就能高枕无忧了么？不尽然。从上面的介绍中我们可以看到，JIT（Just-In-Time）引擎的优化并非是完全无代价的。同时由于JavaScript自身的灵活性，如果我们编写JavaScript代码时并没有将数据类型严格固定，那么JIT（Just-In-Time）的效果将会大打折扣。在GoogleV8团队的《JIT-lessV8》文章中我们可以看到，使用JIT-less模式的V8在运行Youtube的LivingRoom页面时，其测试成绩与使用JIT的V8实际差距仅为6%。这个测试侧面反应了JIT在生产中并不是完全的“性能银弹”。

JIT-less模式下V8与基线的对比

那么JavaScript能变得更快吗？还是说我们需要其他技术来解决JavaScript的性能问题？此时NaCl和PNaCl应运而生。

NaCl与PNaCl

尽管JavaScript由于JIT的加入在性能上有了很大的提升，但在许多性能敏感的领域，JavaScript仍旧无法满足需求。因此在年，Google的BradChen、BennetYee以及DavidSehr开源了NaCl技术，年，NaCl技术正式达到生产可用状态。NaCl全称为“NativeClient”，其由C/C++语言编写并定义了一套NativeCode的安全子集（SFI技术)，同时执行于自己独立的沙盒环境之中，以防止安全性未知的C/C++代码对操作系统本身产生危害。

NaCl应用及其模块在性能上与原生应用的差距非常小，但由于NaCl与CPU架构强关联且不具有可移植性，需要针对不同的平台进行开发和编译，导致开发者无法自由分发NaCl应用及模块。为了解决这个问题，NaCl改进技术PNaCl出现了。

NaCl的性能损耗极小

PNaCl的全称为PortableNativeClient，其通过替换NativeCode为LLVMIR子集并在客户端编译为NaCl的方式解决了NaCl的分发问题。PNaCl不依赖于特定的CPU架构，更易于被部署和使用，“一次编译，到处运行”在PNaCl上得到了实现。但同样的，PNaCl也是运行在自己的独立沙盒之中，其无法直接的访问WebAPIs，而是需要通过一个名为“PPAPI”的接口来与JavaScript通信。

PNaCl技术在当时看起来是一个非常理想的方案，其兼具高性能和易于分发的特点，但实际上在当时并没有受到非常强的支持。PPAPI出现的时代正好是处于人们尽可能试图摆脱Flash、JavaApplet等插件的时代，尽管当时Chrome已经直接集成了NaCl与PNaCl，但其运行在独立沙盒环境与使用独立API的方式，跟Flash、JavaApplet等插件非常类似。同时，其开发难度、成本以及糟糕的兼容性问题（年开始Firefox及Opera正式支持PPAPI及NaCl）都成为了NaCl/PNaCl普及的最大障碍。

让人惊艳的asm.js

谈到asm.js和WebAssembly，就不得不提其中的关键人物AlonZakai。年，AlonZakai结束了两年的创业项目，加入Mozilla负责Android版Firefox的开发。在Mozilla的本职工作之外，AlonZakai继续编写着自己的C/C++游戏引擎。在项目临近尾声之时，AlonZakai突发奇想，想将自己的C/C++游戏引擎运行在浏览器上。在年，NaCl还是一门非常新的技术，而PNaCl才刚刚开始开发，此时并没有一个非常好的技术方案能够将Alon的C/C++游戏引擎跑在浏览器上。

但好在C/C++是强类型语言，而JavaScript是弱类型语言，将C/C++代码编译为JavaScript代码在技术实现上是完全可行的。于是AlonZakai自此开始编写相关的Compiler实现，

Emscripten（LLVMintoJavaScript）

由此诞生了！

到年，Emscripten已经具备编译像Python以及DOOM等中大型项目的能力，与此同时Emscripten也在JSConfEU会议上首次亮相，并取得了一定的影响力。Mozilla看到了Emscripten项目的巨大潜力（相较于NaCl而言对Web更加友好），Brendan及Andreas邀请Alon加入Mozilla的Research团队全职负责Emscripten项目的开发，AlonZakai欣然接受并将工作的重心放在了如何提升Emscripten编译的JavaScript代码执行速度上。

在章节中我们可以看到，尽管JavaScript拥有JIT（Just-In-Time），但由于JavaScript本身的语言特性，导致JIT（Just-In-Time）难以被预测，在实际的生产环境当中JIT（Just-In-Time）的效果往往并没有那么显著。

为了使得JavaScript运行得更快，我们应该要更充分地利用JIT（Just-In-Time），因此在年，AlonZakai联合LukeWagner、DavidHerman发布了asm.js。

asm.js的思想很简单，就是尽可能明确对应的类型，以便JIT（Just-In-Time）被充分利用。如下图示例所示：

我们可以看到，对于

add

函数而言，由于传入参数

x、y

以及返回值进行了

的操作，其能够很明确地为JIT（Just-In-Time）指明对应的类型（i32），因此可以被JIT（Just-In-Time）充分优化（不考虑后期AOT的情况）。

通过添加类似的类型注解，Emscripten编译的asm.js在运行速度上相比普通JavaScript有了质的飞跃。在Benchmark中，asm.js能达到Native性能的50%左右，相比于普通的JavaScript代码而言取得了极大的性能提升，这无疑是让人兴奋的成果。但是asm.js自身也存在一些无法忽视的问题，其总体而言并不是一个非常理想的技术方案。

最显而易见的就是asm.js代码的“慢启动”问题。由于asm.js还是和JavaScript一样的文本格式，因此对于大中型项目而言，其解析花费的时间会非常长，无法与高效的二进制格式相提并论。

其次，asm.js实质上是一种较为hack的实现方式，类似

的类型标注不具有可读性，同时拓展asm.js也变得越来越复杂且不可靠：随着asm.js想要更加接近于Native的执行性能，不免会对诸多Math函数（例如Math.imul及Math.fround等）进行拓展和改写。从长远来看，这对TC39标准的制定并不友好，同时asm.js自身的相关实现（例如memorygrowth等）也遭遇了非常多的问题，导致asm.js标准被迫不断修订。“Thehackshadacost”，我们需要一个全新的技术来解决asm.js所遇到的这些问题。

合作共赢-WebAssembly

在年，NaCl/PNaCl与asm.js/Emscripten形成了不同路线发展的竞争态势，但与此同时，Google及Mozilla也在工具及虚拟机层面加强了许多合作，其中包括：

由Google的JFBastien牵头，每月Google和Mozilla工具团队之间开展交流会；Emscripten和PNaCl开始共享部分代码，包括LegalizationPasses、le32triple等；尝试将NaCl应用通过Emscripten编译，并开源Pepper.js；Google及Mozilla共同向asm.js贡献代码，并规划未来NativeCode在Web上的合理方案；就WebAssembly前身“WebAsm”进行标准和方案的讨论；最终在年的4月1号，“WebAssembly”击败了“WebAsm”、“WebMachine”和其它名称，在Google和Mozilla的团队交流邮件中被确定使用。至年6月17号，两方就WebAssembly的标准化工作达成一致，并搭建了WebAssembly

转载请注明：http://www.aierlanlan.com/rzdk/1711.html

上一篇文章：微软VS将支持C11和C17标准虫虫搜

下一篇文章：华为鸿蒙系统用什么语言如何评价极客谈科