Solidity源文件结构
源文件中可以包含任意多个合约定义、导入指令和杂注指令。
版本杂注
为了避免未来被可能引入不兼容变更的编译器所编译,源文件可以(也应该)被所谓的版本杂注所注解。我们力图把这类变更做到尽可能小,特别是,我们需要以一种当修改语义时必须同步修改语法的方式引入变更,当然这有时候也难以做到。因此,至少对含重大变更的版本,通读变更日志永远是好办法。这些版本的版本号始终是 0.x.0 或者 x.0.0 的形式。
版本杂注使用如下::
pragma solidity ^0.4.0;
这样,源文件将既不允许低于 0.4.0 版本的编译器编译,也不允许高于(包含) 0.5.0 版本的编译器编译(第二个条件因使用 ^ 被添加)。这种做法的考虑是,编译器在 0.5.0 版本之前不会有重大变更,所以可确保源代码始终按预期被编译。上面例子中不固定编译器的具体版本号,因此编译器的补丁版也可以使用。
可以使用更复杂的规则来指定编译器的版本,表达式遵循 npm 版本语义。
Pragma 是 pragmatic information 的简称,微软 Visual C++ 文档 中译为杂注。Solidity 中沿用 C ,C++ 等中的编译指令概念,用于告知编译器 如何 编译。 ——译者注
导入其他源文件
语法与语义
虽然 Solidity 不知道 "default export" 为何物,但是 Solidity 所支持的导入语句,其语法同 JavaScript(从 ES6 起)非常类似。
ES6 即 ECMAScript 6.0,ES6是 JavaScript 语言的下一代标准,已经在 2015 年 6 月正式发布。 ——译者注
在全局层面上,可使用如下格式的导入语句:
import "filename";
此语句将从 “filename” 中导入所有的全局符号到当前全局作用域中(不同于 ES6,Solidity 是向后兼容的)。
import * as symbolName from "filename";
创建一个新的全局符号 symbolName,其成员均来自 "filename" 中全局符号。
import {symbol1 as alias, symbol2} from "filename";
创建新的全局符号 alias 和 symbol2,分别从 "filename" 引用 symbol1 和 symbol2 。
另一种语法不属于 ES6,但或许更简便:
import "filename" as symbolName;
这条语句等同于 import * as symbolName from "filename";。
路径
上文中的 filename 总是会按路径来处理,以 / 作为目录分割符、以 . 标示当前目录、以 .. 表示父目录。
当 . 或 .. 后面跟随的字符是 / 时,它们才能被当做当前目录或父目录。
只有路径以当前目录 . 或父目录 .. 开头时,才能被视为相对路径。
用 import "./x" as x; 语句导入当前源文件同目录下的文件 x 。
如果用 import "x" as x; 代替,可能会引入不同的文件(在全局 include directory 中)。
最终导入哪个文件取决于编译器(见下文)到底是怎样解析路径的。 通常,目录层次不必严格映射到本地文件系统, 它也可以映射到能通过诸如 ipfs,http 或者 git 发现的资源。
在实际的编译器中使用
当运行编译器时,它不仅能指定如何发现路径的第一个元素,还可指定路径前缀 |remapping|。
例如,github.com/ethereum/dapp-bin/library 会被重映射到 /usr/local/dapp-bin/library ,
此时编译器将从重映射位置读取文件。如果重映射到多个路径,优先尝试重映射路径最长的一个。
这允许将比如 "" 被映射到 "/usr/local/include/solidity" 来进行“回退重映射”。
同时,这些重映射可取决于上下文,允许你配置要导入的包,比如同一个库的不同版本。
solc:
对于 solc(命令行编译器),这些重映射以 context:prefix=target 形式的参数提供。
其中,context: 和 =target 部分是可选的(此时 target 默认为 prefix )。
所有重映射的值都是被编译过的常规文件(包括他们的依赖),这个机制完全是向后兼容的(只要文件名不包含 = 或 : ),
因此这不是一个破坏性修改。
在 content 目录或其子目录中的源码文件中,所有导入语句里以 prefix 开头的导入文件都将被用 target 替换 prefix 来重定向。
举个例子,如果你已克隆 github.com/ethereum/dapp-bin/ 到本地 /usr/local/dapp-bin ,
可在源文件中使用:
import "github.com/ethereum/dapp-bin/library/iterable_mapping.sol" as it_mapping;
然后运行编译器:
solc github.com/ethereum/dapp-bin/=/usr/local/dapp-bin/ source.sol
举个更复杂的例子,假设你依赖了一些使用了非常旧版本的 dapp-bin 的模块。
旧版本的 dapp-bin 已经被 checkout 到 /usr/local/dapp-bin_old ,此时你可使用:
solc module1:github.com/ethereum/dapp-bin/=/usr/local/dapp-bin/ \
module2:github.com/ethereum/dapp-bin/=/usr/local/dapp-bin_old/ \
source.sol
这样, module2 中的所有导入都指向旧版本,而 module1 中的导入则获取新版本。
注意, solc 只允许包含来自特定目录的文件:它们必须位于显式地指定的源文件目录(或子目录)中,或者重映射的目标目录(或子目录)中。
如果你想直接用绝对路径来包含文件,只需添加重映射 =/。
如果有多个重映射指向一个有效文件,那么具有最长公共前缀的重映射会被选用。
Remix:
Remix 提供一个为 github 源代码平台的自动重映射,它将通过网络自动获取文件:比如,你可以使用 import "github.com/ethereum/dapp-bin/library/iterable_mapping.sol" as it_mapping; 导入一个 map 迭代器。
未来, Remix 可能支持其他源代码平台。
注释
可以使用单行注释(//)和多行注释(/*...*/)
// 这是一个单行注释。
/*
这是一个
多行注释。
*/
此外,有另一种注释称为 natspec 注释,其文档还尚未编写。
它们是用三个反斜杠(///)或双星号开头的块(/** ... */)书写,它们应该直接在函数声明或语句上使用。
可在注释中使用 Doxygen 样式的标签来文档化函数、
标注形式校验通过的条件,和提供一个当用户试图调用一个函数时显示给用户的 确认文本。
在下面的例子中,我们记录了合约的标题、两个入参和两个返回值的说明:
pragma solidity ^0.4.0;
/** @title 形状计算器。 */
contract shapeCalculator {
/** @dev 求矩形表明面积与周长。
* @param w 矩形宽度。
* @param h 矩形高度。
* @return s 求得表面积。
* @return p 求得周长。
*/
function rectangle(uint w, uint h) returns (uint s, uint p) {
s = w * h;
p = 2 * (w + h);
}
}
合约结构
在 Solidity 中,合约类似于面向对象编程语言中的类。
每个合约中可以包含 状态变量,函数,函数修饰器,事件,结构类型 和 枚举类型的声明,且合约可以从其他合约继承。
状态变量
状态变量是永久地存储在合约存储中的值。
pragma solidity ^0.4.0;
contract SimpleStorage {
uint storedData; // 状态变量
// ...
}
有效的状态变量类型参阅 类型 章节,
对状态变量可见性有可能的选择参阅 可见性和getter函数 。
函数
函数是合约中代码的可执行单元。
pragma solidity ^0.4.0;
contract SimpleAuction {
function bid() public payable { // 函数
// ...
}
}
函数调用可发生在合约内部或外部,且函数对其他合约有不同程度的可见性( 可见性和getter函数)。
函数修饰器
函数修饰器可以用来以声明的方式改良函数语义(参阅合约章节中 函数)。
pragma solidity ^0.4.22;
contract Purchase {
address public seller;
modifier onlySeller() { // 修饰器
require(
msg.sender == seller,
"Only seller can call this."
);
_;
}
function abort() public onlySeller { // Modifier usage
// ...
}
}
事件
事件是能方便地调用Simplechain虚拟机日志功能的接口。
pragma solidity ^0.4.21;
contract SimpleAuction {
event HighestBidIncreased(address bidder, uint amount); // 事件
function bid() public payable {
// ...
emit HighestBidIncreased(msg.sender, msg.value); // 触发事件
}
}
有关如何声明事件和如何在 dapp 中使用事件的信息,参阅合约章节中的 事件。
结构类型
结构是可以将几个变量分组的自定义类型(参阅类型章节中的 结构体)。
pragma solidity ^0.4.0;
contract Ballot {
struct Voter { // 结构
uint weight;
bool voted;
address delegate;
uint vote;
}
}
枚举类型
枚举可用来创建由一定数量的“常量值”构成的自定义类型(参阅类型章节中的 枚举类型)。
pragma solidity ^0.4.0;
contract Purchase {
enum State { Created, Locked, Inactive } // 枚举
}
类型
Solidity 是一种静态类型语言,这意味着每个变量(状态变量和局部变量)都需要在编译时指定变量的类型(或至少可以推导出变量类型——参考下文的 :ref:type-deduction )。
Solidity 提供了几种基本类型,可以用来组合出复杂类型。
除此之外,类型之间可以在包含运算符号的表达式中进行交互。
关于各种运算符号,可以参考 :ref:order 。
值类型
以下类型也称为值类型,因为这些类型的变量将始终按值来传递。 也就是说,当这些变量被用作函数参数或者用在赋值语句中时,总会进行值拷贝。
布尔类型
bool :可能的取值为字面常数值 true 和 false 。
运算符:
!(逻辑非)&&(逻辑与, "and" )||(逻辑或, "or" )==(等于)!=(不等于)
运算符 || 和 && 都遵循同样的短路( short-circuiting )规则。就是说在表达式 f(x) || g(y) 中,
如果 f(x) 的值为 true ,那么 g(y) 就不会被执行,即使会出现一些副作用。
整型
int / uint :分别表示有符号和无符号的不同位数的整型变量。
支持关键字 uint8 到 uint256 (无符号,从 8 位到 256 位)以及 int8 到 int256,以 8 位为步长递增。
uint 和 int 分别是 uint256 和 int256 的别名。
运算符:
- 比较运算符:
<=,<,==,!=,>=,>(返回布尔值) - 位运算符:
&,|,^(异或),~(位取反) - 算数运算符:
+,-, 一元运算-, 一元运算+,*,/,%(取余) ,**(幂),<<(左移位) ,>>(右移位)
除法总是会截断的(仅被编译为 EVM 中的 DIV 操作码),
但如果操作数都是 :ref:字面常数(literals)<rational_literals> (或者字面常数表达式),则不会截断。
除以零或者模零运算都会引发运行时异常。
移位运算的结果取决于运算符左边的类型。
表达式 x << y 与 x * 2**y 是等价的,
x >> y 与 x / 2**y 是等价的。这意味对一个负数进行移位会导致其符号消失。
按负数位移动会引发运行时异常。
.. warning:: 由有符号整数类型负值右移所产生的结果跟其它语言中所产生的结果是不同的。 在 Solidity 中,右移和除是等价的,因此对一个负数进行右移操作会导致向 0 的取整(截断)。 而在其它语言中, 对负数进行右移类似于(向负无穷)取整。
定长浮点型
Solidity 还没有完全支持定长浮点型。可以声明定长浮点型的变量,但不能给它们赋值或把它们赋值给其他变量。
fixed / ufixed:表示各种大小的有符号和无符号的定长浮点型。
在关键字 ufixedMxN 和 fixedMxN 中,M 表示该类型占用的位数,N 表示可用的小数位数。
M 必须能整除 8,即 8 到 256 位。
N 则可以是从 0 到 80 之间的任意数。
ufixed 和 fixed 分别是 ufixed128x19 和 fixed128x19 的别名。
运算符:
- 比较运算符:
<=,<,==,!=,>=,>(返回值是布尔型) - 算术运算符:
+,-, 一元运算-, 一元运算+,*,/,%(取余数)
.. note::
浮点型(在许多语言中的 float 和 double 类型,更准确地说是 IEEE 754 类型)和定长浮点型之间最大的不同点是,
在前者中整数部分和小数部分(小数点后的部分)需要的位数是灵活可变的,而后者中这两部分的长度受到严格的规定。
一般来说,在浮点型中,几乎整个空间都用来表示数字,但只有少数的位来表示小数点的位置。
地址类型
address:地址类型存储一个 20 字节的值(Simplechain地址的大小)。
地址类型也有成员变量,并作为所有合约的基础。
运算符:
<=,<,==,!=,>=和>
从 0.5.0 版本开始,合约不会从地址类型派生,但仍然可以显式地转换成地址类型。
地址类型成员变量
balance和transfer
快速参考,请见 :ref:address_related。
可以使用 balance 属性来查询一个地址的余额,
也可以使用 transfer 函数向一个地址发送 |ether| (以 wei 为单位):
address x = 0x123;
address myAddress = this;
if (x.balance < 10 && myAddress.balance >= 10) x.transfer(10);
如果
x是一个合约地址,它的代码(更具体来说是它的 fallback 函数,如果有的话)会跟transfer函数调用一起执行(这是 EVM 的一个特性,无法阻止)。 如果在执行过程中用光了 gas 或者因为任何原因执行失败,|ether| 交易会被打回,当前的合约也会在终止的同时抛出异常。
send
send 是 transfer 的低级版本。如果执行失败,当前的合约不会因为异常而终止,但 send 会返回 false。
在使用
send的时候会有些风险:如果调用栈深度是 1024 会导致发送失败(这总是可以被调用者强制),如果接收者用光了 gas 也会导致发送失败。所以为了保证 |ether| 发送的安全,一定要检查send的返回值,使用transfer或者更好的办法:使用一种接收者可以取回资金的模式。
call,callcode和delegatecall
此外,为了与不符合 |ABI| 的合约交互,于是就有了可以接受任意类型任意数量参数的 call 函数。
这些参数会被打包到以 32 字节为单位的连续区域中存放。
其中一个例外是当第一个参数被编码成正好 4 个字节的情况。
在这种情况下,这个参数后边不会填充后续参数编码,以允许使用函数签名。
address nameReg = 0x72ba7d8e73fe8eb666ea66babc8116a41bfb10e2;
nameReg.call("register", "MyName");
nameReg.call(bytes4(keccak256("fun(uint256)")), a);
call 返回的布尔值表明了被调用的函数已经执行完毕(true)或者引发了一个 EVM 异常(false)。
无法访问返回的真实数据(为此我们需要事先知道编码和大小)。
可以使用 .gas() |modifier| 调整提供的 gas 数量:
namReg.call.gas(1000000)("register", "MyName");
类似地,也能控制提供的 |ether| 的值 :
nameReg.call.value(1 ether)("register", "MyName");
最后一点,这些 |modifier| 可以联合使用。每个修改器出现的顺序不重要 :
nameReg.call.gas(1000000).value(1 ether)("register", "MyName");
目前还不能在重载函数中使用 gas 或者 value。一种解决方案是给 gas 和值引入一个特例,并重新检查它们是否在重载的地方出现。
类似地,也可以使用 delegatecall:区别在于只使用给定地址的代码,其它属性(存储,余额,……)都取自当前合约。delegatecall 的目的是使用存储在另外一个合约中的库代码。用户必须确保两个合约中的存储结构都适用于 delegatecall。在 homestead 版本之前,只有一个功能类似但作用有限的 callcode 的函数可用,但它不能获取委托方的 msg.sender 和 msg.value。
这三个函数 call, delegatecall 和 callcode 都是非常低级的函数,应该只把它们当作 最后一招 来使用,因为它们破坏了 Solidity 的类型安全性。
所有合约都继承了地址(address)的成员变量,因此可以使用
this.balance查询当前合约的余额。不鼓励使用
callcode,在未来也会将其移除。这三个函数都属于低级函数,需要谨慎使用。具体来说,任何未知的合约都可能是恶意的。你在调用一个合约的同时就将控制权交给了它,它可以反过来调用你的合约,因此,当调用返回时要为你的状态变量的改变做好准备。
定长字节数组
关键字有:bytes1, bytes2, bytes3, ..., bytes32。byte 是 bytes1 的别名。
运算符:
- 比较运算符:
<=,<,==,!=,>=,>(返回布尔型) - 位运算符:
&,|,^(按位异或),~(按位取反),<<(左移位),>>(右移位) - 索引访问:如果
x是bytesI类型,那么x[k](其中0 <= k < I)返回第k个字节(只读)。
该类型可以和作为右操作数的任何整数类型进行移位运算(但返回结果的类型和左操作数类型相同),右操作数表示需要移动的位数。 进行负数位移运算会引发运行时异常。
成员变量:
.length表示这个字节数组的长度(只读).
可以将
byte[]当作字节数组使用,但这种方式非常浪费存储空间,准确来说,是在传入调用时,每个元素会浪费 31 字节。 更好地做法是使用bytes。
变长字节数组
bytes:
变长字节数组,参见 :ref:arrays。它并不是值类型。
string:
变长 UTF-8 编码字符串类型,参见 :ref:arrays。并不是值类型。
地址字面常数(Address Literals)
比如像 0xdCad3a6d3569DF655070DEd06cb7A1b2Ccd1D3AF 这样的通过了地址校验和测试的十六进制字面常数属于 address 类型。长度在 39 到 41 个数字的,没有通过校验和测试而产生了一个警告的十六进制字面常数视为正常的有理数字面常数。
混合大小写的地址校验和格式定义在 EIP-55中。
有理数和整数字面常数
整数字面常数由范围在 0-9 的一串数字组成,表现成十进制。例如,69 表示数字 69。
Solidity 中是没有八进制的,因此前置 0 是无效的。
十进制小数字面常数带有一个 .,至少在其一边会有一个数字。比如:1.,.1,和 1.3。
科学符号也是支持的,尽管指数必须是整数,但底数可以是小数。比如:2e10, -2e10, 2e-10, 2.5e1。
数值字面常数表达式本身支持任意精度,除非它们被转换成了非字面常数类型(也就是说,当它们出现在非字面常数表达式中时就会发生转换)。 这意味着在数值常量表达式中, 计算不会溢出而除法也不会截断。
例如, (2**800 + 1) - 2**800 的结果是字面常数 1 (属于 uint8 类型),尽管计算的中间结果已经超过了 |evm| 的机器字长度。
此外, .5 * 8 的结果是整型 4 (尽管有非整型参与了计算)。
只要操作数是整型,任意整型支持的运算符都可以被运用在数值字面常数表达式中。 如果两个中的任一个数是小数,则不允许进行位运算。如果指数是小数的话,也不支持幂运算(因为这样可能会得到一个无理数)。
Solidity 对每个有理数都有对应的数值字面常数类型。整数字面常数和有理数字面常数都属于数值字面常数类型。 除此之外,所有的数值字面常数表达式(即只包含数值字面常数和运算符的表达式)都属于数值字面常数类型。 因此数值字面常数表达式
1 + 2和2 + 1的结果跟有理数三的数值字面常数类型相同。在早期版本中,整数字面常数的除法也会截断,但在现在的版本中,会将结果转换成一个有理数。即
5 / 2并不等于2,而是等于2.5。数值字面常数表达式只要在非字面常数表达式中使用就会转换成非字面常数类型。在下面的例子中,尽管我们知道
b的值是一个整数,但2.5 + a这部分表达式并不进行类型检查,因此编译不能通过。
uint128 a = 1;
uint128 b = 2.5 + a + 0.5;
字符串字面常数
字符串字面常数是指由双引号或单引号引起来的字符串("foo" 或者 'bar')。
不像在 C 语言中那样带有结束符;"foo" 相当于 3 个字节而不是 4 个。
和整数字面常数一样,字符串字面常数的类型也可以发生改变,但它们可以隐式地转换成 bytes1,……,bytes32,如果合适的话,还可以转换成 bytes 以及 string。
字符串字面常数支持转义字符,例如 \n,\xNN 和 \uNNNN。\xNN 表示一个 16 进制值,最终转换成合适的字节,而 \uNNNN 表示 Unicode 编码值,最终会转换为 UTF-8 的序列。
十六进制字面常数
十六进制字面常数以关键字 hex 打头,后面紧跟着用单引号或双引号引起来的字符串(例如,hex"001122FF")。
字符串的内容必须是一个十六进制的字符串,它们的值将使用二进制表示。
十六进制字面常数跟字符串字面常数很类似,具有相同的转换规则。
枚举类型
pragma solidity ^0.4.16;
contract test {
enum ActionChoices { GoLeft, GoRight, GoStraight, SitStill }
ActionChoices choice;
ActionChoices constant defaultChoice = ActionChoices.GoStraight;
function setGoStraight() public {
choice = ActionChoices.GoStraight;
}
// 由于枚举类型不属于 |ABI| 的一部分,因此对于所有来自 Solidity 外部的调用,
// "getChoice" 的签名会自动被改成 "getChoice() returns (uint8)"。
// 整数类型的大小已经足够存储所有枚举类型的值,随着值的个数增加,
// 可以逐渐使用 `uint16` 或更大的整数类型。
function getChoice() public view returns (ActionChoices) {
return choice;
}
function getDefaultChoice() public pure returns (uint) {
return uint(defaultChoice);
}
}
函数类型
函数类型是一种表示函数的类型。可以将一个函数赋值给另一个函数类型的变量,也可以将一个函数作为参数进行传递,还能在函数调用中返回函数类型变量。 函数类型有两类:- 内部(internal) 函数和 外部(external) 函数:
内部函数只能在当前合约内被调用(更具体来说,在当前代码块内,包括内部库函数和继承的函数中),因为它们不能在当前合约上下文的外部被执行。 调用一个内部函数是通过跳转到它的入口标签来实现的,就像在当前合约的内部调用一个函数。
外部函数由一个地址和一个函数签名组成,可以通过外部函数调用传递或者返回。
函数类型表示成如下的形式 ::
function (<parameter types>) {internal|external} [pure|constant|view|payable] [returns (<return types>)]
与参数类型相反,返回类型不能为空 —— 如果函数类型不需要返回,则需要删除整个 returns 部分。
函数类型默认是内部函数,因此不需要声明 internal 关键字。
与此相反的是,合约中的函数本身默认是 public 的,只有当它被当做类型名称时,默认才是内部函数。
有两种方法可以访问当前合约中的函数:一种是直接使用它的名字,f ,另一种是使用 this.f 。
前者适用于内部函数,后者适用于外部函数。
如果当函数类型的变量还没有初始化时就调用它的话会引发一个异常。
如果在一个函数被 delete 之后调用它也会发生相同的情况。
如果外部函数类型在 Solidity 的上下文环境以外的地方使用,它们会被视为 function 类型。
该类型将函数地址紧跟其函数标识一起编码为一个 bytes24 类型。。
请注意,当前合约的 public 函数既可以被当作内部函数也可以被当作外部函数使用。
如果想将一个函数当作内部函数使用,就用 f 调用,如果想将其当作外部函数,使用 this.f 。
除此之外,public(或 external)函数也有一个特殊的成员变量称作 selector,可以返回ABI 函数选择器
pragma solidity ^0.4.16;
contract Selector {
function f() public view returns (bytes4) {
return this.f.selector;
}
}
如果使用内部函数类型的例子::
pragma solidity ^0.4.16;
library ArrayUtils {
// 内部函数可以在内部库函数中使用,
// 因为它们会成为同一代码上下文的一部分
function map(uint[] memory self, function (uint) pure returns (uint) f)
internal
pure
returns (uint[] memory r)
{
r = new uint[](self.length);
for (uint i = 0; i < self.length; i++) {
r[i] = f(self[i]);
}
}
function reduce(
uint[] memory self,
function (uint, uint) pure returns (uint) f
)
internal
pure
returns (uint r)
{
r = self[0];
for (uint i = 1; i < self.length; i++) {
r = f(r, self[i]);
}
}
function range(uint length) internal pure returns (uint[] memory r) {
r = new uint[](length);
for (uint i = 0; i < r.length; i++) {
r[i] = i;
}
}
}
contract Pyramid {
using ArrayUtils for *;
function pyramid(uint l) public pure returns (uint) {
return ArrayUtils.range(l).map(square).reduce(sum);
}
function square(uint x) internal pure returns (uint) {
return x * x;
}
function sum(uint x, uint y) internal pure returns (uint) {
return x + y;
}
}
另外一个使用外部函数类型的例子::
pragma solidity ^0.4.11;
contract Oracle {
struct Request {
bytes data;
function(bytes memory) external callback;
}
Request[] requests;
event NewRequest(uint);
function query(bytes data, function(bytes memory) external callback) public {
requests.push(Request(data, callback));
NewRequest(requests.length - 1);
}
function reply(uint requestID, bytes response) public {
// 这里要验证 reply 来自可信的源
requests[requestID].callback(response);
}
}
contract OracleUser {
Oracle constant oracle = Oracle(0x1234567); // 已知的合约
function buySomething() {
oracle.query("USD", this.oracleResponse);
}
function oracleResponse(bytes response) public {
require(msg.sender == address(oracle));
// 使用数据
}
}
Lambda 表达式或者内联函数的引入在计划内,但目前还没支持。
引用类型
比起之前讨论过的值类型,在处理复杂的类型(即占用的空间超过 256 位的类型)时,我们需要更加谨慎。
由于拷贝这些类型变量的开销相当大,我们不得不考虑它的存储位置,是将它们保存在 memory(并不是永久存储)中,
还是 storage(保存状态变量的地方)中。
数据位置
所有的复杂类型,即 数组 和 结构 类型,都有一个额外属性,“数据位置”,说明数据是保存在 memory 中还是 storage 中。根据上下文不同,大多数时候数据有默认的位置,但也可以通过在类型名后增加关键字 storage 或 memory 进行修改。函数参数(包括返回的参数)的数据位置默认是 memory,局部变量的数据位置默认是 storage,状态变量的数据位置强制是 storage (这是显而易见的)。
也存在第三种数据位置, calldata ,这是一块只读的,且不会永久存储的位置,用来存储函数参数。外部函数的参数(非返回参数)的数据位置被强制指定为 calldata ,效果跟 memory 差不多。
数据位置的指定非常重要,因为它们影响着赋值行为:
在 storage 和 memory 之间两两赋值,或者 storage 向状态变量(甚至是从其它状态变量)赋值都会创建一份独立的拷贝。然而状态变量向局部变量赋值时仅仅传递一个引用,而且这个引用总是指向状态变量,因此后者改变的同时前者也会发生改变。另一方面,从一个 memory 存储的引用类型向另一个 memory 存储的引用类型赋值并不会创建拷贝。
pragma solidity ^0.4.0;
contract C {
uint[] x; // x 的数据存储位置是 storage
// memoryArray 的数据存储位置是 memory
function f(uint[] memoryArray) public {
x = memoryArray; // 将整个数组拷贝到 storage 中,可行
var y = x; // 分配一个指针(其中 y 的数据存储位置是 storage),可行
y[7]; // 返回第 8 个元素,可行
y.length = 2; // 通过 y 修改 x,可行
delete x; // 清除数组,同时修改 y,可行
// 下面的就不可行了;需要在 storage 中创建新的未命名的临时数组, /
// 但 storage 是“静态”分配的:
// y = memoryArray;
// 下面这一行也不可行,因为这会“重置”指针,
// 但并没有可以让它指向的合适的存储位置。
// delete y;
g(x); // 调用 g 函数,同时移交对 x 的引用
h(x); // 调用 h 函数,同时在 memory 中创建一个独立的临时拷贝
}
function g(uint[] storage storageArray) internal {}
function h(uint[] memoryArray) public {}
}
总结
强制指定的数据位置:
- 外部函数的参数(不包括返回参数): calldata
- 状态变量: storage
默认数据位置:
- 函数参数(包括返回参数): memory
- 所有其它局部变量: storage
数组
数组可以在声明时指定长度,也可以动态调整大小。
对于 storage 的数组来说,元素类型可以是任意的(即元素也可以是数组类型,映射类型或者结构体)。
对于 memory 的数组来说,元素类型不能是映射类型,如果作为 public 函数的参数,它只能是 ABI 类型。
一个元素类型为 T,固定长度为 k 的数组可以声明为 T[k],而动态数组声明为 T[]。
举个例子,一个长度为 5,元素类型为 uint 的动态数组的数组,应声明为 uint[][5] (注意这里跟其它语言比,数组长度的声明位置是反的)。
要访问第三个动态数组的第二个元素,你应该使用 x[2][1](数组下标是从 0 开始的,且访问数组时的下标顺序与声明时相反,也就是说,x[2] 是从右边减少了一级)。。
bytes 和 string 类型的变量是特殊的数组。
bytes 类似于 byte[],但它在 calldata 中会被“紧打包”(译者注:将元素连续地存在一起,不会按每 32 字节一单元的方式来存放)。
string 与 bytes 相同,但(暂时)不允许用长度或索引来访问。
.. note::
如果想要访问以字节表示的字符串 s,请使用 bytes(s).length / bytes(s)[7] = 'x';。
注意这时你访问的是 UTF-8 形式的低级 bytes 类型,而不是单个的字符。
可以将数组标识为 public,从而让 Solidity 创建一个 getter。
之后必须使用数字下标作为参数来访问 getter。
创建内存数组
可使用 new 关键字在内存中创建变长数组。
与 storage 数组相反的是,你 不能 通过修改成员变量 length 改变 memory 数组的大小。
pragma solidity ^0.4.16;
contract C {
function f(uint len) public pure {
uint[] memory a = new uint[](7);
bytes memory b = new bytes(len);
// 这里我们有 a.length == 7 以及 b.length == len
a[6] = 8;
}
}
数组字面常数 / 内联数组
数组字面常数是写作表达式形式的数组,并且不会立即赋值给变量。
pragma solidity ^0.4.16;
contract C {
function f() public pure {
g([uint(1), 2, 3]);
}
function g(uint[3] _data) public pure {
// ...
}
}
数组字面常数是一种定长的 |memory| 数组类型,它的基础类型由其中元素的普通类型决定。
例如,[1, 2, 3] 的类型是 uint8[3] memory,因为其中的每个字面常数的类型都是 uint8。
正因为如此,有必要将上面这个例子中的第一个元素转换成 uint 类型。
目前需要注意的是,定长的 memory 数组并不能赋值给变长的 memory 数组,下面是个反例:
// 这段代码并不能编译。
pragma solidity ^0.4.0;
contract C {
function f() public {
// 这一行引发了一个类型错误,因为 unint[3] memory
// 不能转换成 uint[] memory。
uint[] x = [uint(1), 3, 4];
}
}
已经计划在未来移除这样的限制,但目前数组在 ABI 中传递的问题造成了一些麻烦。
成员
length:
数组有 length 成员变量表示当前数组的长度。动态数组可以在 storage(而不是 memory )中通过改变成员变量 .length 改变数组大小。并不能通过访问超出当前数组长度的方式实现自动扩展数组的长度。一经创建,memory 数组的大小就是固定的(但却是动态的,也就是说,它依赖于运行时的参数)。
push:
变长的 |storage| 数组以及 bytes 类型(而不是 string 类型)都有一个叫做 push 的成员函数,它用来附加新的元素到数组末尾。这个函数将返回新的数组长度。
在外部函数中目前还不能使用多维数组。
由于 |evm| 的限制,不能通过外部函数调用返回动态的内容。例如,如果通过 web3.js 调用
contract C { function f() returns (uint[]) { ... } }中的f函数,它会返回一些内容,但通过 Solidity 不可以。
目前唯一的变通方法是使用大型的静态数组。
pragma solidity ^0.4.16;
contract ArrayContract {
uint[2**20] m_aLotOfIntegers;
// 注意下面的代码并不是一对动态数组,
// 而是一个数组元素为一对变量的动态数组(也就是数组元素为长度为 2 的定长数组的动态数组)。
bool[2][] m_pairsOfFlags;
// newPairs 存储在 memory 中 —— 函数参数默认的存储位置
function setAllFlagPairs(bool[2][] newPairs) public {
// 向一个 storage 的数组赋值会替代整个数组
m_pairsOfFlags = newPairs;
}
function setFlagPair(uint index, bool flagA, bool flagB) public {
// 访问一个不存在的数组下标会引发一个异常
m_pairsOfFlags[index][0] = flagA;
m_pairsOfFlags[index][1] = flagB;
}
function changeFlagArraySize(uint newSize) public {
// 如果 newSize 更小,那么超出的元素会被清除
m_pairsOfFlags.length = newSize;
}
function clear() public {
// 这些代码会将数组全部清空
delete m_pairsOfFlags;
delete m_aLotOfIntegers;
// 这里也是实现同样的功能
m_pairsOfFlags.length = 0;
}
bytes m_byteData;
function byteArrays(bytes data) public {
// 字节的数组(语言意义中的 byte 的复数 ``bytes``)不一样,因为它们不是填充式存储的,
// 但可以当作和 "uint8[]" 一样对待
m_byteData = data;
m_byteData.length += 7;
m_byteData[3] = byte(8);
delete m_byteData[2];
}
function addFlag(bool[2] flag) public returns (uint) {
return m_pairsOfFlags.push(flag);
}
function createMemoryArray(uint size) public pure returns (bytes) {
// 使用 `new` 创建动态 memory 数组:
uint[2][] memory arrayOfPairs = new uint[2][](size);
// 创建一个动态字节数组:
bytes memory b = new bytes(200);
for (uint i = 0; i < b.length; i++)
b[i] = byte(i);
return b;
}
}
结构体
Solidity 支持通过构造结构体的形式定义新的类型,以下是一个结构体使用的示例:
pragma solidity ^0.4.11;
contract CrowdFunding {
// 定义的新类型包含两个属性。
struct Funder {
address addr;
uint amount;
}
struct Campaign {
address beneficiary;
uint fundingGoal;
uint numFunders;
uint amount;
mapping (uint => Funder) funders;
}
uint numCampaigns;
mapping (uint => Campaign) campaigns;
function newCampaign(address beneficiary, uint goal) public returns (uint campaignID) {
campaignID = numCampaigns++; // campaignID 作为一个变量返回
// 创建新的结构体示例,存储在 storage 中。我们先不关注映射类型。
campaigns[campaignID] = Campaign(beneficiary, goal, 0, 0);
}
function contribute(uint campaignID) public payable {
Campaign storage c = campaigns[campaignID];
// 以给定的值初始化,创建一个新的临时 memory 结构体,
// 并将其拷贝到 storage 中。
// 注意你也可以使用 Funder(msg.sender, msg.value) 来初始化。
c.funders[c.numFunders++] = Funder({addr: msg.sender, amount: msg.value});
c.amount += msg.value;
}
function checkGoalReached(uint campaignID) public returns (bool reached) {
Campaign storage c = campaigns[campaignID];
if (c.amount < c.fundingGoal)
return false;
uint amount = c.amount;
c.amount = 0;
c.beneficiary.transfer(amount);
return true;
}
}
上面的合约只是一个简化版的众筹合约,但它已经足以让我们理解结构体的基础概念。 结构体类型可以作为元素用在映射和数组中,其自身也可以包含映射和数组作为成员变量。
尽管结构体本身可以作为映射的值类型成员,但它并不能包含自身。这个限制是有必要的,因为结构体的大小必须是有限的。
注意在函数中使用结构体时,一个结构体是如何赋值给一个局部变量(默认存储位置是 storage)的。在这个过程中并没有拷贝这个结构体,而是保存一个引用,所以对局部变量成员的赋值实际上会被写入状态。
当然,你也可以直接访问结构体的成员而不用将其赋值给一个局部变量,就像这样,
campaigns[campaignID].amount = 0。
映射
映射类型在声明时的形式为 mapping(_KeyType => _ValueType)。
其中 _KeyType 可以是除了映射、变长数组、合约、枚举以及结构体以外的几乎所有类型。
_ValueType 可以是包括映射类型在内的任何类型。
映射可以视作 哈希表,它们在实际的初始化过程中创建每个可能的 key,并将其映射到字节形式全是零的值:一个类型的默认值。然而下面是映射与哈希表不同的地方:
在映射中,实际上并不存储 key,而是存储它的 keccak256 哈希值,从而便于查询实际的值。
正因为如此,映射是没有长度的,也没有 key 的集合或 value 的集合的概念。只有状态变量(或者在 internal 函数中的对于存储变量的引用)可以使用映射类型。。
可以将映射声明为 public,然后来让 Solidity 创建一个getter。_KeyType 将成为 getter 的必须参数,并且 getter 会返回 _ValueType。_ValueType 也可以是一个映射。这时在使用 getter 时将将需要递归地传入每个 _KeyType 参数。
pragma solidity ^0.4.0;
contract MappingExample {
mapping(address => uint) public balances;
function update(uint newBalance) public {
balances[msg.sender] = newBalance;
}
}
contract MappingUser {
function f() public returns (uint) {
MappingExample m = new MappingExample();
m.update(100);
return m.balances(this);
}
}
映射不支持迭代,但可以在此之上实现一个这样的数据结构。例子可以参考: 可迭代的映射
涉及 LValues 的运算符
如果 a 是一个 LValue(即一个变量或者其它可以被赋值的东西),以下运算符都可以使用简写:
a += e 等同于 a = a + e。 其它运算符 -=, *=, /=, %=, |=, &= 以及 ^= 都是如此定义的。
a++ 和 a-- 分别等同于 a += 1 和 a -= 1,但表达式本身的值等于 a 在计算之前的值。
与之相反,--a 和 ++a 虽然最终 a 的结果与之前的表达式相同,但表达式的返回值是计算之后的值。
删除
delete a 的结果是将 a 的类型在初始化时的值赋值给 a。即对于整型变量来说,相当于 a = 0,
但 delete 也适用于数组,对于动态数组来说,是将数组的长度设为 0,而对于静态数组来说,是将数组中的所有元素重置。
如果对象是结构体,则将结构体中的所有属性重置。
delete 对整个映射是无效的(因为映射的键可以是任意的,通常也是未知的)。
因此在你删除一个结构体时,结果将重置所有的非映射属性,这个过程是递归进行的,除非它们是映射。
然而,单个的键及其映射的值是可以被删除的。
理解 delete a 的效果就像是给 a 赋值很重要,换句话说,这相当于在 a 中存储了一个新的对象。
pragma solidity ^0.4.0;
contract DeleteExample {
uint data;
uint[] dataArray;
function f() public {
uint x = data;
delete x; // 将 x 设为 0,并不影响数据
delete data; // 将 data 设为 0,并不影响 x,因为它仍然有个副本
uint[] storage y = dataArray;
delete dataArray;
// 将 dataArray.length 设为 0,但由于 uint[] 是一个复杂的对象,y 也将受到影响,
// 因为它是一个存储位置是 storage 的对象的别名。
// 另一方面:"delete y" 是非法的,引用了 storage 对象的局部变量只能由已有的 storage 对象赋值。
}
}
基本类型之间的转换
隐式转换
如果一个运算符用在两个不同类型的变量之间,那么编译器将隐式地将其中一个类型转换为另一个类型(不同类型之间的赋值也是一样)。一般来说,只要值类型之间的转换在语义上行得通,而且转换的过程中没有信息丢失,那么隐式转换基本都是可以实现的:
uint8 可以转换成 uint16,int128 转换成 int256,但 int8 不能转换成 uint256(因为 uint256 不能涵盖某些值,例如,-1)。更进一步来说,无符号整型可以转换成跟它大小相等或更大的字节类型,但反之不能。任何可以转换成 uint160 的类型都可以转换成 address 类型。
显式转换
如果某些情况下编译器不支持隐式转换,但是你很清楚你要做什么,这种情况可以考虑显式转换。
注意这可能会发生一些无法预料的后果,因此一定要进行测试,确保结果是你想要的!
下面的示例是将一个 int8 类型的负数转换成 uint:
int8 y = -3;
uint x = uint(y);
这段代码的最后,x 的值将是 0xfffff..fd (64 个 16 进制字符),因为这是 -3 的 256 位补码形式。
如果一个类型显式转换成更小的类型,相应的高位将被舍弃:
uint32 a = 0x12345678;
uint16 b = uint16(a); // 此时 b 的值是 0x5678
类型推断
为了方便起见,没有必要每次都精确指定一个变量的类型,编译器会根据分配该变量的第一个表达式的类型自动推断该变量的类型:
uint24 x = 0x123;
var y = x;
这里 y 的类型将是 uint24。不能对函数参数或者返回参数使用 var。
类型只能从第一次赋值中推断出来,因此以下代码中的循环是无限的,原因是
i的类型是uint8,而这个类型变量的最大值比2000小。for (var i = 0; i < 2000; i++) { ... }
单元和全局变量
sipc单位
sipc单位之间的换算就是在数字后边加上 wei、 finney、 szabo 或 ether 来实现的,如果后面没有单位,缺省为 Wei。例如 2 ether == 2000 finney 的逻辑判断值为 true。
时间单位
秒是缺省时间单位,在时间单位之间,数字后面带有 seconds、 minutes、 hours、 days、 weeks 和 years 的可以进行换算,基本换算关系如下:
1 == 1 seconds1 minutes == 60 seconds1 hours == 60 minutes1 days == 24 hours1 weeks == 7 days1 years == 365 days
由于闰秒造成的每年不都是 365 天、每天不都是 24 小时 leap seconds,所以如果你要使用这些单位计算日期和时间,请注意这个问题。因为闰秒是无法预测的,所以需要借助外部的预言机(oracle,是一种链外数据服务,译者注)来对一个确定的日期代码库进行时间矫正。
years后缀已经不推荐使用了,因为从 0.5.0 版本开始将不再支持。
这些后缀不能直接用在变量后边。如果想用时间单位(例如 days)来将输入变量换算为时间,你可以用如下方式来完成:
function f(uint start, uint daysAfter) public {
if (now >= start + daysAfter * 1 days) {
// ...
}
}
特殊变量和函数
在全局命名空间中已经存在了(预设了)一些特殊的变量和函数,他们主要用来提供关于区块链的信息或一些通用的工具函数。
.. index:: abi, block, coinbase, difficulty, encode, number, block;number, timestamp, block;timestamp, msg, data, gas, sender, value, now, gas price, origin
区块和交易属性
block.blockhash(uint blockNumber) returns (bytes32):指定区块的区块哈希——仅可用于最新的 256 个区块且不包括当前区块;而 blocks 从 0.4.22 版本开始已经不推荐使用,由blockhash(uint blockNumber)代替block.coinbase(address): 挖出当前区块的矿工地址block.difficulty(uint): 当前区块难度block.gaslimit(uint): 当前区块 gas 限额block.number(uint): 当前区块号block.timestamp(uint): 自 unix epoch 起始当前区块以秒计的时间戳gasleft() returns (uint256):剩余的 gasmsg.data(bytes): 完整的 calldatamsg.gas(uint): 剩余 gas - 自 0.4.21 版本开始已经不推荐使用,由gesleft()代替msg.sender(address): 消息发送者(当前调用)msg.sig(bytes4): calldata 的前 4 字节(也就是函数标识符)msg.value(uint): 随消息发送的 wei 的数量now(uint): 目前区块时间戳(block.timestamp)tx.gasprice(uint): 交易的 gas 价格tx.origin(address): 交易发起者(完全的调用链)
对于每一个外部函数调用,包括
msg.sender和msg.value在内所有msg成员的值都会变化。这里包括对库函数的调用。不要依赖
block.timestamp、now和blockhash产生随机数,除非你知道自己在做什么。 时间戳和区块哈希在一定程度上都可能受到挖矿矿工影响。例如,挖矿社区中的恶意矿工可以用某个给定的哈希来运行赌场合约的 payout 函数,而如果他们没收到钱,还可以用一个不同的哈希重新尝试。当前区块的时间戳必须严格大于最后一个区块的时间戳,但这里唯一能确保的只是它会是在权威链上的两个连续区块的时间戳之间的数值。基于可扩展因素,区块哈希不是对所有区块都有效。你仅仅可以访问最近 256 个区块的哈希,其余的哈希均为零。
ABI 编码函数
abi.encode(...) returns (bytes):ABI对给定参数进行编码abi.encodePacked(...) returns (bytes):对给定参数执行紧打包编码abi.encodeWithSelector(bytes4 selector, ...) returns (bytes):ABI对给定参数进行编码,并以给定的函数选择器作为起始的 4 字节数据一起返回abi.encodeWithSignature(string signature, ...) returns (bytes):等价于abi.encodeWithSelector(bytes4(keccak256(signature), ...)
这些编码函数可以用来构造函数调用数据,而不用实际进行调用。此外,
keccak256(abi.encodePacked(a, b))是更准确的方法来计算在未来版本不推荐使用的keccak256(a, b)。
更多详情请参考ABI和 紧打包编码。
错误处理
assert(bool condition):
如果条件不满足,则使当前交易没有效果 — 用于检查内部错误。
require(bool condition):
如果条件不满足则撤销状态更改 - 用于检查由输入或者外部组件引起的错误。
require(bool condition, string message):
如果条件不满足则撤销状态更改 - 用于检查由输入或者外部组件引起的错误,可以同时提供一个错误消息。
revert():
终止运行并撤销状态更改。
revert(string reason):
终止运行并撤销状态更改,可以同时提供一个解释性的字符串。
数学和密码学函数
addmod(uint x, uint y, uint k) returns (uint):计算 (x + y) % k,加法会在任意精度下执行,并且加法的结果即使超过 2**256 也不会被截取。从 0.5.0 版本的编译器开始会加入对 k != 0 的校验(assert)。
mulmod(uint x, uint y, uint k) returns (uint):计算 (x * y) % k,乘法会在任意精度下执行,并且乘法的结果即使超过 2**256 也不会被截取。从 0.5.0 版本的编译器开始会加入对 k != 0 的校验(assert)。
keccak256(...) returns (bytes32): 计算 :ref:(tightly packed) arguments <abi_packed_mode> 的 Ethereum-SHA-3 (Keccak-256)哈希。
sha256(...) returns (bytes32):计算 :ref:(tightly packed) arguments <abi_packed_mode> 的 SHA-256 哈希。
sha3(...) returns (bytes32):等价于 keccak256。
ripemd160(...) returns (bytes20):计算 :ref:(tightly packed) arguments <abi_packed_mode> 的 RIPEMD-160 哈希。
ecrecover(bytes32 hash, uint8 v, bytes32 r, bytes32 s) returns (address) :利用椭圆曲线签名恢复与公钥相关的地址,错误返回零值。example usage
上文中的tightly packed是指不会对参数值进行 padding 处理(就是说所有参数值的字节码是连续存放的,译者注),这意味着下边这些调用都是等价的:
keccak256("ab", "c")
keccak256("abc")
keccak256(0x616263)
keccak256(6382179)
keccak256(97, 98, 99)
如果需要 padding,可以使用显式类型转换:keccak256("\x00\x12") 和 keccak256(uint16(0x12)) 是一样的。
请注意,常量值会使用存储它们所需要的最少字节数进行打包。例如:keccak256(0) == keccak256(uint8(0)),keccak256(0x12345678) == keccak256(uint32(0x12345678))。
在一个私链上,你很有可能碰到由于 sha256、ripemd160 或者 ecrecover 引起的 Out-of-Gas。原因是因为这些密码学函数在Simplechain虚拟机中以“预编译合约”形式存在的,且在第一次收到消息后才被真正存在(尽管合约代码是EVM中已存在的硬编码)。因此发送到不存在的合约的消息非常昂贵,所以实际的执行会导致 Out-of-Gas 错误。在你实际使用你的合约之前,给每个合约发送一点儿Sipc,比如 1 Wei。这在官方网络或测试网络上不是问题。
地址相关
<address>.balance (uint256):以 Wei 为单位的 :ref:address 的余额。
<address>.transfer(uint256 amount):向 :ref:address 发送数量为 amount 的 Wei,失败时抛出异常,发送 2300 gas 的矿工费,不可调节。
<address>.send(uint256 amount) returns (bool):向 :ref:address 发送数量为 amount 的 Wei,失败时返回 false,发送 2300 gas 的矿工费用,不可调节。
<address>.call(...) returns (bool):发出低级函数 CALL,失败时返回 false,发送所有可用 gas,可调节。
<address>.callcode(...) returns (bool):发出低级函数 CALLCODE,失败时返回 false,发送所有可用 gas,可调节。
<address>.delegatecall(...) returns (bool):发出低级函数 DELEGATECALL,失败时返回 false,发送所有可用 gas,可调节。
更多信息,参考 :ref:address 部分:
使用 send 有很多危险:如果调用栈深度已经达到 1024(这总是可以由调用者所强制指定),转账会失败;并且如果接收者用光了 gas,转账同样会失败。为了保证以太币转账安全,总是检查
send的返回值,利用transfer或者下面更好的方式: 用这种接收者取回钱的模式。如果在通过低级函数 delegatecall 发起调用时需要访问存储中的变量,那么这两个合约的存储中的变量定义顺序需要一致,以便被调用的合约代码可以正确地通过变量名访问合约的存储变量。这当然不是指像在高级的库函数调用时所传递的存储变量指针那样的情况。
不鼓励使用
callcode,并且将来它会被移除。
合约相关
this (current contract's type):当前合约,可以明确转换为 :ref:address。
selfdestruct(address recipient):销毁合约,并把余额发送到指定 :ref:address。
suicide(address recipient):与 selfdestruct 等价,但已不推荐使用。
此外,当前合约内的所有函数都可以被直接调用,包括当前函数。
表达式和控制结构
输入参数和输出参数
与 Javascript 一样,函数可能需要参数作为输入;而与 Javascript 和 C 不同的是,它们可能返回任意数量的参数作为输出。
输入参数
输入参数的声明方式与变量相同。但是有一个例外,未使用的参数可以省略参数名。 例如,如果我们希望合约接受有两个整数形参的函数的外部调用,我们会像下面这样写
pragma solidity ^0.4.16;
contract Simple {
function taker(uint _a, uint _b) public pure {
// 用 _a 和 _b 实现相关功能.
}
}
输出参数
输出参数的声明方式在关键词 returns 之后,与输入参数的声明方式相同。
例如,如果我们需要返回两个结果:两个给定整数的和与积,我们应该写作
pragma solidity ^0.4.16;
contract Simple {
function arithmetics(uint _a, uint _b)
public
pure
returns (uint o_sum, uint o_product)
{
o_sum = _a + _b;
o_product = _a * _b;
}
}
输出参数名可以被省略。输出值也可以使用 return 语句指定。
return 语句也可以返回多值,参阅:ref:multi-return。
返回的输出参数被初始化为 0;如果它们没有被显式赋值,它们就会一直为 0。
输入参数和输出参数可以在函数体中用作表达式。因此,它们也可用在等号左边被赋值。
控制结构
JavaScript 中的大部分控制结构在 Solidity 中都是可用的,除了 switch 和 goto。因此 Solidity 中有 if,else,while,do,for,break,continue,return,? : 这些与在 C 或者 JavaScript 中表达相同语义的关键词。
用于表示条件的括号 不可以 被省略,单语句体两边的花括号可以被省略。注意,与 C 和 JavaScript 不同, Solidity 中非布尔类型数值不能转换为布尔类型,因此 if (1) { ... } 的写法在 Solidity 中 无效 。
返回多个值
当一个函数有多个输出参数时, return (v0, v1, ...,vn) 写法可以返回多个值。不过元素的个数必须与输出参数的个数相同。
函数调用
内部函数调用
当前合约中的函数可以直接(“从内部”)调用,也可以递归调用,就像下边这个荒谬的例子一样
pragma solidity ^0.4.16;
contract C {
function g(uint a) public pure returns (uint ret) { return f(); }
function f() internal pure returns (uint ret) { return g(7) + f(); }
}
这些函数调用在 EVM 中被解释为简单的跳转。这样做的效果就是当前内存不会被清除,也就是说,通过内部调用在函数之间传递内存引用是非常有效的。
外部函数调用
表达式 this.g(8); 和 c.g(2); (其中 c 是合约实例)也是有效的函数调用,但是这种情况下,函数将会通过一个消息调用来被“外部调用”,而不是直接的跳转。
请注意,不可以在构造函数中通过 this 来调用函数,因为此时真实的合约实例还没有被创建。
如果想要调用其他合约的函数,需要外部调用。对于一个外部调用,所有的函数参数都需要被复制到内存。
当调用其他合约的函数时,随函数调用发送的 Wei 和 gas 的数量可以分别由特定选项 .value() 和 .gas() 指定::
pragma solidity ^0.4.0;
contract InfoFeed {
function info() public payable returns (uint ret) { return 42; }
}
contract Consumer {
InfoFeed feed;
function setFeed(address addr) public { feed = InfoFeed(addr); }
function callFeed() public { feed.info.value(10).gas(800)(); }
}
payable 修饰符要用于修饰 info,否则,.value() 选项将不可用。
注意,表达式 InfoFeed(addr) 进行了一个的显式类型转换,说明”我们知道给定地址的合约类型是 InfoFeed “并且这不会执行构造函数。
显式类型转换需要谨慎处理。绝对不要在一个你不清楚类型的合约上执行函数调用。
我们也可以直接使用 function setFeed(InfoFeed _feed) { feed = _feed; } 。
注意一个事实,feed.info.value(10).gas(800) 只(局部地)设置了与函数调用一起发送的 Wei 值和 gas 的数量,只有最后的圆括号执行了真正的调用。
如果被调函数所在合约不存在(也就是账户中不包含代码)或者被调用合约本身抛出异常或者 gas 用完等,函数调用会抛出异常。
任何与其他合约的交互都会强加潜在危险,尤其是在不能预先知道合约代码的情况下。 当前合约将控制权移交给被调用合约,而被调用合约可能做任何事。即使被调用合约从一个已知父合约继承,继承的合约也只需要有一个正确的接口就可以了。 被调用合约的实现可以完全任意,因此会带来危险。此外,请小心万一它再调用你系统中的其他合约,或者甚至在第一次调用返回之前返回到你的调用合约。 这意味着被调用合约可以通过它自己的函数改变调用合约的状态变量。。一个建议的函数写法是,例如,在你合约中状态变量进行各种变化后再调用外部函数,这样,你的合约就不会轻易被滥用的重入 (reentrancy) 所影响
具名调用和匿名函数参数
如果它们被包含在 {} 中,函数调用参数也可以按照任意顺序由名称给出,
如以下示例中所示。参数列表必须按名称与函数声明中的参数列表相符,但可以按任意顺序排列。
pragma solidity ^0.4.0;
contract C {
function f(uint key, uint value) public {
// ...
}
function g() public {
// 具名参数
f({value: 2, key: 3});
}
}
省略函数参数名称
未使用参数的名称(特别是返回参数)可以省略。这些参数仍然存在于堆栈中,但它们无法访问。
pragma solidity ^0.4.16;
contract C {
// 省略参数名称
function func(uint k, uint) public pure returns(uint) {
return k;
}
}
通过 new 创建合约
使用关键字 new 可以创建一个新合约。待创建合约的完整代码必须事先知道,因此递归的创建依赖是不可能的。
pragma solidity ^0.4.0;
contract D {
uint x;
function D(uint a) public payable {
x = a;
}
}
contract C {
D d = new D(4); // 将作为合约 C 构造函数的一部分执行
function createD(uint arg) public {
D newD = new D(arg);
}
function createAndEndowD(uint arg, uint amount) public payable {
//随合约的创建发送 ether
D newD = (new D).value(amount)(arg);
}
}
如示例中所示,使用 .value() 选项创建 D 的实例时可以转发 Ether,但是不可能限制 gas 的数量。如果创建失败(可能因为栈溢出,或没有足够的余额或其他问题),会引发异常。
表达式计算顺序
表达式的计算顺序不是特定的(更准确地说,表达式树中某节点的字节点间的计算顺序不是特定的,但它们的结算肯定会在节点自己的结算之前)。该规则只能保证语句按顺序执行,布尔表达式的短路执行。更多相关信息,请参阅::ref:order。
赋值
解构赋值和返回多值
Solidity 内部允许元组 (tuple) 类��,也就是一个在编译时元素数量固定的对象列表,列表中的元素可以是不同类型的对象。这些元组可以用来同时返回多个数值,也可以用它们来同时给多个新声明的变量或者既存的变量(或通常的 LValues):
pragma solidity >0.4.23 <0.5.0;
contract C {
uint[] data;
function f() public pure returns (uint, bool, uint) {
return (7, true, 2);
}
function g() public {
//基于返回的元组来声明变量并赋值
(uint x, bool b, uint y) = f();
//交换两个值的通用窍门——但不适用于非值类型的存储 (storage) 变量。
(x, y) = (y, x);
//元组的末尾元素可以省略(这也适用于变量声明)。
(data.length,,) = f(); // 将长度设置为 7
//省略元组中末尾元素的写法,仅可以在赋值操作的左侧使用,除了这个例外:
(x,) = (1,);
//(1,) 是指定单元素元组的唯一方法,因为 (1)
//相当于 1。
}
}
直到 0.4.24 版本,给具有更少的元素数的元组赋值都可以可能的,无论是在左边还是右边(比如在最后空出若干元素)。现在,这已经不推荐了,赋值操作的两边应该具有相同个数的组成元素。
数组和结构体的复杂性
赋值语义对于像数组和结构体这样的非值类型来说会有些复杂。
为状态变量 赋值 经常会创建一个独立副本。另一方面,对局部变量的赋值只会为基本类型(即 32 字节以内的静态类型)创建独立的副本。如果结构体或数组(包括 bytes 和 string)被从状态变量分配给局部变量,局部变量将保留对原始状态变量的引用。对局部变量的第二次赋值不会修改状态变量,只会改变引用。赋值给局部变量的成员(或元素)则 改变 状态变量。
作用域和声明
变量声明后将有默认初始值,其初始值字节表示全部为零。任何类型变量的“默认值”是其对应类型的典型“零状态”。例如, bool 类型的默认值是 false 。 uint 或 int 类型的默认值是 0 。对于静态大小的数组和 bytes1 到 bytes32 ,每个单独的元素将被初始化为与其类型相对应的默认值。
最后,对于动态大小的数组, bytes 和 string 类型,其默认缺省值是一个空数组或字符串。
Solidity 中的作用域规则遵循了 C99(与其他很多语言一样):变量将会从它们被声明之后可见,直到一对 { } 块的结束。作为一个例外,在 for 循环语句中初始化的变量,其可见性仅维持到 for 循环的结束。
那些定义在代码块之外的变量,比如函数、合约、自定义类型等等,并不会影响它们的作用域特性。这意味着你可以在实际声明状态变量的语句之前就使用它们,并且递归地调用函数。
基于以上的规则,下边的例子不会出现编译警告,因为那两个变量虽然名字一样,但却在不同的作用域里。
pragma solidity >0.4.24;
contract C {
function minimalScoping() pure public {
{
uint same2 = 0;
}
{
uint same2 = 0;
}
}
}
作为 C99 作用域规则的特例,请注意在下边的例子里,第一次对 x 的赋值会改变上一层中声明的变量值。如果外层声明的变量被“影子化”(就是说被在内部作用域中由一个同名变量所替代)你会得到一个警告。
pragma solidity >0.4.24;
contract C {
function f() pure public returns (uint) {
uint x = 1;
{
x = 2; // 这个赋值会影响在外层声明的变量
uint x;
}
return x; // x has value 2
}
}
在 Solidity 0.5.0 之前的版本,作用域规则都沿用了 Javascript 的规则,即一个变量可以声明在函数的任意位置,都可以使他在整个函数范围内可见。而这种规则会从 0.5.0 版本起被打破。从 0.5.0 版本开始,下面例子中的代码段会导致编译错误。
// 这将无法编译通过
pragma solidity >0.4.24;
contract C {
function f() pure public returns (uint) {
x = 2;
uint x;
return x;
}
}
错误处理:Assert, Require, Revert and Exceptions
Solidity 使用状态恢复异常来处理错误。这种异常将撤消对当前调用(及其所有子调用)中的状态所做的所有更改,并且还向调用者标记错误。
便利函数 assert 和 require 可用于检查条件并在条件不满足时抛出异常。assert 函数只能用于测试内部错误,并检查非变量。
require 函数用于确认条件有效性,例如输入变量,或合约状态变量是否满足条件,或验证外部合约调用返回的值。
如果使用得当,分析工具可以评估你的合约,并标示出那些会使 assert 失败的条件和函数调用。
正常工作的代码不会导致一个 assert 语句的失败;如果这发生了,那就说明出现了一个需要你修复的 bug。
还有另外两种触发异常的方法:revert 函数可以用来标记错误并恢复当前的调用。
revert 调用中包含有关错误的详细信息是可能的,这个消息会被返回给调用者。已经不推荐的关键字 throw 也可以用来替代 revert() (但无法返回错误消息)。
从 0.4.13 版本开始,
throw这个关键字被弃用,并且将来会被逐渐淘汰。
当子调用发生异常时,它们会自动“冒泡”(即重新抛出异常)。这个规则的例外是 send 和低级函数 call , delegatecall 和 callcode --如果这些函数发生异常,将返回 false ,而不是“冒泡”。
作为 EVM 设计的一部分,如果被调用合约帐户不存在,则低级函数
call,delegatecall和callcode将返回 success。因此如果需要使用低级函数时,必须在调用之前检查被调用合约是否存在。异常捕获还未实现
在下例中,你可以看到如何轻松使用require检查输入条件以及如何使用assert检查内部错误,注意,你可以给 require 提供一个消息字符串,而 assert 不行。
pragma solidity ^0.4.22;
contract Sharer {
function sendHalf(address addr) public payable returns (uint balance) {
require(msg.value % 2 == 0, "Even value required.");
uint balanceBeforeTransfer = this.balance;
addr.transfer(msg.value / 2);
//由于转移函数在失败时抛出异常并且不能在这里回调,因此我们应该没有办法仍然有一半的钱。
assert(this.balance == balanceBeforeTransfer - msg.value / 2);
return this.balance;
}
}
下列情况将会产生一个 assert 式异常:
- 如果你访问数组的索引太大或为负数(例如
x[i]其中i >= x.length或i < 0)。 - 如果你访问固定长度
bytesN的索引太大或为负数。 - 如果你用零当除数做除法或模运算(例如
5 / 0或23 % 0)。 - 如果你移位负数位。
- 如果你将一个太大或负数值转换为一个枚举类型。
- 如果你调用内部函数类型的零初始化变量。
- 如果你调用
assert的参数(表达式)最终结算为 false。
下列情况将会产生一个 require 式异常:
- 调用
throw。 - 如果你调用
require的参数(表达式)最终结算为false。 - 如果你通过消息调用调用某个函数,但该函数没有正确结束(它耗尽了 gas,没有匹配函数,或者本身抛出一个异常),上述函数不包括低级别的操作
call,send,delegatecall或者callcode。低级操作不会抛出异常,而通过返回false来指示失败。 - 如果你使用
new关键字创建合约,但合约没有正确创建(请参阅上条有关”未正确完成“的定义)。 - 如果你对不包含代码的合约执行外部函数调用。
- 如果你的合约通过一个没有
payable修饰符的公有函数(包括构造函数和 fallback 函数)接收 Ether。 - 如果你的合约通过公有 getter 函数接收 Ether 。
- 如果
.transfer()失败。
在内部, Solidity 对一个 require 式的异常执行回退操作(指令 0xfd )并执行一个无效操作(指令 0xfe )来引发 assert 式异常。在这两种情况下,都会导致 EVM 回退对状态所做的所有更改。回退的原因是不能继续安全地执行,因为没有实现预期的效果。因为我们想保留交易的原子性,所以最安全的做法是回退所有更改并使整个交易(或至少是调用)不产生效果。请注意, assert 式异常消耗了所有可用的调用 gas ,而从 Metropolis 版本起 require 式的异常不会消耗任何 gas。
下边的例子展示了如何在 revert 和 require 中使用错误字符串:
pragma solidity ^0.4.22;
contract VendingMachine {
function buy(uint amount) payable {
if (amount > msg.value / 2 ether)
revert("Not enough Ether provided.");
// 下边是等价的方法来做同样的检查:
require(
amount <= msg.value / 2 ether,
"Not enough Ether provided."
);
// 执行购买操作
}
}
这里提供的字符串应该是经过 :ref:ABI 编码 <ABI> 之后的,因为它实际上是调用了 Error(string) 函数。在上边的例子里,revert("Not enough Ether provided."); 会产生如下的十六进制错误返回值:
- 0x08c379a0 // Error(string) 的函数选择器
- 0x0000000000000000000000000000000000000000000000000000000000000020 // 数据的偏移量(32)
- 0x000000000000000000000000000000000000000000000000000000000000001a // 字符串长度(26)
- 0x4e6f7420656e6f7567682045746865722070726f76696465642e000000000000 // 字符串数据("Not enough Ether provided." 的 ASCII 编码,26字节)
合约
Solidity 合约类似于面向对象语言中的类。合约中有用于数据持久化的状态变量,和可以修改状态变量的函数。
调用另一个合约实例的函数时,会执行一个 EVM 函数调用,这个操作会切换执行时的上下文,这样,前一个合约的状态变量就不能访问了。
创建合约
可以通过Simplechain交易“从外部”或从 Solidity 合约内部创建合约。
一些集成开发环境,例如 Remix, 通过使用一些用户界面元素使创建过程更加流畅。在Simplechain上编程创建合约最好使用 JavaScript API web3.j。现在,我们已经有了一个叫做 web3.eth.Contract 的方法能够更容易的创建合约。
创建合约时,会执行一次构造函数(与合约同名的函数)。构造函数是可选的。只允许有一个构造函数,这意味着不支持重载。
在内部,构造函数参数在合约代码之后通ABI 编码传递,但是如果你使用 web3.js则不必关心这个问题。
如果一个合约想要创建另一个合约,那么创建者必须知晓被创建合约的源代码(和二进制代码)。 这意味着不可能循环创建依赖项。
pragma solidity ^0.4.16;
contract OwnedToken {
// TokenCreator 是如下定义的合约类型.
// 不创建新合约的话,也可以引用它。
TokenCreator creator;
address owner;
bytes32 name;
// 这是注册 creator 和设置名称的构造函数。
function OwnedToken(bytes32 _name) public {
// 状态变量通过其名称访问,而不是通过例如 this.owner 的方式访问。
// 这也适用于函数,特别是在构造函数中,你只能像这样(“内部地”)调用它们,
// 因为合约本身还不存在。
owner = msg.sender;
// 从 `address` 到 `TokenCreator` ,是做显式的类型转换
// 并且假定调用合约的类型是 TokenCreator,没有真正的方法来检查这一点。
creator = TokenCreator(msg.sender);
name = _name;
}
function changeName(bytes32 newName) public {
// 只有 creator (即创建当前合约的合约)能够更改名称 —— 因为合约是隐式转换为地址的,
// 所以这里的比较是可行的。
if (msg.sender == address(creator))
name = newName;
}
function transfer(address newOwner) public {
// 只有当前所有者才能发送 token。
if (msg.sender != owner) return;
// 我们也想询问 creator 是否可以发送。
// 请注意,这里调用了一个下面定义的合约中的函数。
// 如果调用失败(比如,由于 gas 不足),会立即停止执行。
if (creator.isTokenTransferOK(owner, newOwner))
owner = newOwner;
}
}
contract TokenCreator {
function createToken(bytes32 name)
public
returns (OwnedToken tokenAddress)
{
// 创建一个新的 Token 合约并且返回它的地址。
// 从 JavaScript 方面来说,返回类型是简单的 `address` 类型,因为
// 这是在 ABI 中可用的最接近的类型。
return new OwnedToken(name);
}
function changeName(OwnedToken tokenAddress, bytes32 name) public {
// 同样,`tokenAddress` 的外部类型也是 `address` 。
tokenAddress.changeName(name);
}
function isTokenTransferOK(address currentOwner, address newOwner)
public
view
returns (bool ok)
{
// 检查一些任意的情况。
address tokenAddress = msg.sender;
return (keccak256(newOwner) & 0xff) == (bytes20(tokenAddress) & 0xff);
}
}
可见性和 getter 函数
由于 Solidity 有两种函数调用(内部调用不会产生实际的 EVM 调用或称为“消息调用”,而外部调用则会产生一个 EVM 调用),函数和状态变量有四种可见性类型。函数可以指定为 external ,public ,internal 或者 private,默认情况下函数类型为 public。
对于状态变量,不能设置为 external ,默认是 internal 。
external:外部函数作为合约接口的一部分,意味着我们可以从其他合约和交易中调用。 一个外部函数f不能从内部调用(即f不起作用,但this.f()可以)。 当收到大量数据的时候,外部函数有时候会更有效率。public:public 函数是合约接口的一部分,可以在内部或通过消息调用。对于公共状态变量,会自动生成一个 getter 函数(见下面)。internal:这些函数和状态变量只能是内部访问(即从当前合约内部或从它派生的合约访问),不使用this调用。private:private 函数和状态变量仅在当前定义它们的合约中使用,并且不能被派生合约使用。
合约中的所有内容对外部观察者都是可见的。设置一些
private类型只能阻止其他合约访问和修改这些信息,但是对于区块链外的整个世界它仍然是可见的。
可见性标识符的定义位置,对于状态变量来说是在类型后面,对于函数是在参数列表和返回关键字中间。
pragma solidity ^0.4.16;
contract C {
function f(uint a) private pure returns (uint b) { return a + 1; }
function setData(uint a) internal { data = a; }
uint public data;
}
在下面的例子中,D 可以调用 c.getData() 来获取状态存储中 data 的值,但不能调用 f 。
合约 E 继承自 C ,因此可以调用 compute。
// 下面代码编译错误
pragma solidity ^0.4.0;
contract C {
uint private data;
function f(uint a) private returns(uint b) { return a + 1; }
function setData(uint a) public { data = a; }
function getData() public returns(uint) { return data; }
function compute(uint a, uint b) internal returns (uint) { return a+b; }
}
contract D {
function readData() public {
C c = new C();
uint local = c.f(7); // 错误:成员 `f` 不可见
c.setData(3);
local = c.getData();
local = c.compute(3, 5); // 错误:成员 `compute` 不可见
}
}
contract E is C {
function g() public {
C c = new C();
uint val = compute(3, 5); // 访问内部成员(从继承合约访问父合约成员)
}
}
Getter 函数
编译器自动为所有 public 状态变量创建 getter 函数。对于下面给出的合约,编译器会生成一个名为 data 的函数,
该函数不会接收任何参数并返回一个 uint ,即状态变量 data 的值。可以在声明时完成状态变量的初始化。
pragma solidity ^0.4.0;
contract C {
uint public data = 42;
}
contract Caller {
C c = new C();
function f() public {
uint local = c.data();
}
}
getter 函数具有外部可见性。如果在内部访问 getter(即没有 this. ),它被认为一个状态变量。
如果它是外部访问的(即用 this. ),它被认为为一个函数。
pragma solidity ^0.4.0;
contract C {
uint public data;
function x() public {
data = 3; // 内部访问
uint val = this.data(); // 外部访问
}
}
下一个例子稍微复杂一些:
pragma solidity ^0.4.0;
contract Complex {
struct Data {
uint a;
bytes3 b;
mapping (uint => uint) map;
}
mapping (uint => mapping(bool => Data[])) public data;
}
这将会生成以下形式的函数 ::
function data(uint arg1, bool arg2, uint arg3) public returns (uint a, bytes3 b) {
a = data[arg1][arg2][arg3].a;
b = data[arg1][arg2][arg3].b;
}
请注意,因为没有好的方法来提供映射的键,所以结构中的映射被省略。
函数 |modifier|
使用 |modifier| 可以轻松改变函数的行为。 例如,它们可以在执行函数之前自动检查某个条件。 |modifier| 是合约的可继承属性, 并可能被派生合约覆盖。
pragma solidity ^0.4.11;
contract owned {
function owned() public { owner = msg.sender; }
address owner;
// 这个合约只定义一个修饰器,但并未使用: 它将会在派生合约中用到。
// 修饰器所修饰的函数体会被插入到特殊符号 _; 的位置。
// 这意味着如果是 owner 调用这个函数,则函数会被执行,否则会抛出异常。
modifier onlyOwner {
require(msg.sender == owner);
_;
}
}
contract mortal is owned {
// 这个合约从 `owned` 继承了 `onlyOwner` 修饰符,并将其应用于 `close` 函数,
// 只有在合约里保存的 owner 调用 `close` 函数,才会生效。
function close() public onlyOwner {
selfdestruct(owner);
}
}
contract priced {
// 修改器可以接收参数:
modifier costs(uint price) {
if (msg.value >= price) {
_;
}
}
}
contract Register is priced, owned {
mapping (address => bool) registeredAddresses;
uint price;
function Register(uint initialPrice) public { price = initialPrice; }
// 在这里也使用关键字 `payable` 非常重要,否则函数会自动拒绝所有发送给它的以太币。
function register() public payable costs(price) {
registeredAddresses[msg.sender] = true;
}
function changePrice(uint _price) public onlyOwner {
price = _price;
}
}
contract Mutex {
bool locked;
modifier noReentrancy() {
require(!locked);
locked = true;
_;
locked = false;
}
// 这个函数受互斥量保护,这意味着 `msg.sender.call` 中的重入调用不能再次调用 `f`。
// `return 7` 语句指定返回值为 7,但修改器中的语句 `locked = false` 仍会执行。
function f() public noReentrancy returns (uint) {
require(msg.sender.call());
return 7;
}
}
如果同一个函数有多个 modifier,它们之间以空格隔开,modifier会依次检查执行。
在早期的 Solidity 版本中,有 |modifier| 的函数,
return语句的行为表现不同。
modifier 或函数体中显式的 return 语句仅仅跳出当前的 modifier 和函数体。
返回变量会被赋值,但整个执行逻辑会从前一个 |modifier| 中的定义的 “_” 之后继续执行。
modifier的参数可以是任意表达式,在此上下文中,所有在函数中可见的符号,在 modifier 中均可见。在 modifier 中引入的符号在函数中不可见(可能被重载改变)。
Constant 状态变量
状态变量可以被声明为 constant。在这种情况下,只能使用那些在编译时有确定值的表达式来给它们赋值。任何通过访问 storage,区块链数据(例如 now, this.balance 或者 block.number)或执行数据( msg.gas )或对外部合约的调用来给它们赋值都是不允许的。在内存分配上有边界效应(side-effect)的表达式是允许的,但对其他内存对象产生边界效应的表达式则不行。内建(built-in)函数 keccak256,sha256,ripemd160,ecrecover,addmod 和 mulmod 是允许的(即使他们确实会调用外部合约)。
允许带有边界效应的内存分配器的原因是这将允许构建复杂的对象,比如查找表(lookup-table)。 此功能尚未完全可用。编译器不会为这些变量预留存储,它们的每次出现都会被替换为相应的常量表达式(这将可能被优化器计算为实际的某个值)。不是所有类型的状态变量都支持用 constant 来修饰,当前支持的仅有值类型和字符串。
pragma solidity ^0.4.0;
contract C {
uint constant x = 32**22 + 8;
string constant text = "abc";
bytes32 constant myHash = keccak256("abc");
}
函数
View 函数
可以将函数声明为 view 类型,这种情况下要保证不修改状态。
下面的语句被认为是修改状态:
- 修改状态变量。
产生事件。创建其它合约。- 使用
selfdestruct。 - 通过调用发送以太币。
- 调用任何没有标记为
view或者pure的函数。 - 使用低级调用。
- 使用包含特定操作码的内联汇编。
pragma solidity ^0.4.16;
contract C {
function f(uint a, uint b) public view returns (uint) {
return a * (b + 42) + now;
}
}
constant是view的别名。Getter 方法被标记为
view。编译器没有强制
view方法不能修改状态。
Pure 函数
函数可以声明为 pure ,在这种情况下,承诺不读取或修改状态。除了上面解释的状态修改语句列表之外,以下被认为是从状态中读取:
- 读取状态变量。
- 访问
this.balance或者<address>.balance。 - 访问
block,tx,msg中任意成员 (除msg.sig和msg.data之外)。 - 调用任何未标记为
pure的函数。 - 使用包含某些操作码的内联汇编。
pragma solidity ^0.4.16;
contract C {
function f(uint a, uint b) public pure returns (uint) {
return a * (b + 42);
}
}
编译器没有强制
pure方法不能读取状态。
Fallback 函数
合约可以有一个未命名的函数。这个函数不能有参数也不能有返回值。如果在一个到合约的调用中,没有其他函数与给定的函数标识符匹配(或没有提供调用数据),那么这个函数(fallback 函数)会被执行。
除此之外,每当合约收到以太币(没有任何数据),这个函数就会执行。此外,为了接收以太币,fallback 函数必须标记为 payable。如果不存在这样的函数,则合约不能通过常规交易接收以太币。
在这样的上下文中,通常只有很少的 gas 可以用来完成这个函数调用(准确地说,是 2300 gas),所以使 fallback 函数的调用尽量廉价很重要。请注意,调用 fallback 函数的交易(而不是内部调用)所需的 gas 要高得多,因为每次交易都会额外收取 21000 gas 或更多的费用,用于签名检查等操作。
具体来说,以下操作会消耗比 fallback 函数更多的 gas:
- 写入存储
- 创建合约
- 调用消耗大量 gas 的外部函数
- 发送以太币
请确保您在部署合约之前彻底测试您的 fallback 函数,以确保执行成本低于 2300 个 gas。
即使 fallback 函数不能有参数,仍然可以使用
msg.data来获取随调用提供的任何有效数据。一个没有定义 fallback 函数的合约,直接接收以太币(没有函数调用,即使用
send或transfer)会抛出一个异常,并返还以太币(在 Solidity v0.4.0 之前行为会有所不同)。所以如果你想让你的合约接收以太币,必须实现 fallback 函数。一个没有 payable fallback 函数的合约,可以作为
coinbase transaction(又名miner block reward)的接收者或者作为selfdestruct的目标来接收以太币。一个合约不能对这种以太币转移做出反应,因此也不能拒绝它们。这是 EVM 在设计时就决定好的,而且 Solidity 无法绕过这个问题。
这也意味着
this.balance可以高于合约中实现的一些手工记帐的总和(即在 fallback 函数中更新的累加器)。
pragma solidity ^0.4.0;
contract Test {
// 发送到这个合约的所有消息都会调用此函数(因为该合约没有其它函数)。
// 向这个合约发送以太币会导致异常,因为 fallback 函数没有 `payable` 修饰符
function() public { x = 1; }
uint x;
}
// 这个合约会保留所有发送给它的以太币,没有办法返还。
contract Sink {
function() public payable { }
}
contract Caller {
function callTest(Test test) public {
test.call(0xabcdef01); // 不存在的哈希
// 导致 test.x 变成 == 1。
// 以下将不会编译,但如果有人向该合约发送以太币,交易将失败并拒绝以太币。
// test.send(2 ether);
}
}
函数重载
合约可以具有多个不同参数的同名函数。这也适用于继承函数。以下示例展示了合约 A 中的重载函数 f。
pragma solidity ^0.4.16;
contract A {
function f(uint _in) public pure returns (uint out) {
out = 1;
}
function f(uint _in, bytes32 _key) public pure returns (uint out) {
out = 2;
}
}
重载函数也存在于外部接口中。如果两个外部可见函数仅区别于 Solidity 内的类型而不是它们的外部类型则会导致错误。
```bash
// 以下代码无法编译
pragma solidity ^0.4.16;
contract A {
function f(B _in) public pure returns (B out) {
out = _in;
}
function f(address _in) public pure returns (address out) {
out = _in;
}
}
contract B {
}
以上两个 f 函数重载都接受了 ABI 的地址类型,虽然它们在 Solidity 中被认为是不同的。
重载解析和参数匹配
通过将当前范围内的函数声明与函数调用中提供的参数相匹配,可以选择重载函数。 如果所有参数都可以隐式地转换为预期类型,则选择函数作为重载候选项。如果一个候选都没有,解析失败。
返回参数不作为重载解析的依据。
pragma solidity ^0.4.16;
contract A {
function f(uint8 _in) public pure returns (uint8 out) {
out = _in;
}
function f(uint256 _in) public pure returns (uint256 out) {
out = _in;
}
}
调用 f(50) 会导致类型错误,因为 50 既可以被隐式转换为 uint8 也可以被隐式转换为 uint256。另一方面,调用 f(256) 则会解析为 f(uint256) 重载,因为 256 不能隐式转换为 uint8。
事件
事件允许我们方便地使用 EVM 的日志基础设施。我们可以在 dapp 的用户界面中监听事件,EVM 的日志机制可以反过来“调用”用来监听事件的 Javascript 回调函数。
事件在合约中可被继承。当他们被调用时,会使参数被存储到交易的日志中 —— 一种区块链中的特殊数据结构。这些日志与地址相关联,被并入区块链中,只要区块可以访问就一直存在(在 Frontier 和 Homestead 版本中会被永久保存,在 Serenity 版本中可能会改动)。日志和事件在合约内不可直接被访问(甚至是创建日志的合约也不能访问)。
对日志的 SPV(Simplified Payment Verification)证明是可能的,如果一个外部实体提供了一个带有这种证明的合约,它可以检查日志是否真实存在于区块链中。但需要留意的是,由于合约中仅能访问最近的 256 个区块哈希,所以还需要提供区块头信息。
最多三个参数可以接收 indexed 属性,从而使它们可以被搜索:在用户界面上可以使用 indexed 参数的特定值来进行过滤。
如果数组(包括 string 和 bytes)类型被标记为索引项,则它们的 keccak-256 哈希值会被作为 topic 保存。除非你用 anonymous 说明符声明事件,否则事件签名的哈希值是 topic 之一。同时也意味着对于匿名事件无法通过名字来过滤。所有非索引参数都将存储在日志的数据部分中。
索引参数本身不会被保存。你只能搜索它们的值(来确定相应的日志数据是否存在),而不能获取它们的值本身。
pragma solidity ^0.4.0;
contract ClientReceipt {
event Deposit(
address indexed _from,
bytes32 indexed _id,
uint _value
);
function deposit(bytes32 _id) public payable {
// 我们可以过滤对 `Deposit` 的调用,从而用 Javascript API 来查明对这个函数的任何调用(甚至是深度嵌套调用)。
Deposit(msg.sender, _id, msg.value);
}
}
使用 JavaScript API 调用事件的用法如下:
var abi = /* abi 由编译器产生 */;
var ClientReceipt = web3.eth.contract(abi);
var clientReceipt = ClientReceipt.at("0x1234...ab67" /* 地址 */);
var event = clientReceipt.Deposit();
// 监视变化
event.watch(function(error, result){
// 结果包括对 `Deposit` 的调用参数在内的各种信息。
if (!error)
console.log(result);
});
// 或者通过回调立即开始观察
var event = clientReceipt.Deposit(function(error, result) {
if (!error)
console.log(result);
});
日志的底层接口
通过函数 log0,log1, log2, log3 和 log4 可以访问日志机制的底层接口。logi 接受 i + 1 个 bytes32 类型的参数。其中第一个参数会被用来做为日志的数据部分,其它的会做为 topic。上面的事件调用可以以相同的方式执行。
pragma solidity ^0.4.10;
contract C {
function f() public payable {
bytes32 _id = 0x420042;
log3(
bytes32(msg.value),
bytes32(0x50cb9fe53daa9737b786ab3646f04d0150dc50ef4e75f59509d83667ad5adb20),
bytes32(msg.sender),
_id
);
}
}
其中的长十六进制数的计算方法是 keccak256("Deposit(address,hash256,uint256)"),即事件的签名。
其它学习事件机制的资源
继承
通过复制包括多态的代码,Solidity 支持多重继承。所有的函数调用都是虚拟的,这意味着最远的派生函数会被调用,除非明确给出合约名称。当一个合约从多个合约继承时,在区块链上只有一个合约被创建,所有基类合约的代码被复制到创建的合约中。
总的来说,Solidity 的继承系统与 Python的继承系统,非常相似,特别是多重继承方面。
下面的例子进行了详细的说明。
pragma solidity ^0.4.16;
contract owned {
function owned() { owner = msg.sender; }
address owner;
}
// 使用 is 从另一个合约派生。派生合约可以访问所有非私有成员,包括内部函数和状态变量,
// 但无法通过 this 来外部访问。
contract mortal is owned {
function kill() {
if (msg.sender == owner) selfdestruct(owner);
}
}
// 这些抽象合约仅用于给编译器提供接口。
// 注意函数没有函数体。
// 如果一个合约没有实现所有函数,则只能用作接口。
contract Config {
function lookup(uint id) public returns (address adr);
}
contract NameReg {
function register(bytes32 name) public;
function unregister() public;
}
// 可以多重继承。请注意,owned 也是 mortal 的基类,
// 但只有一个 owned 实例(就像 C++ 中的虚拟继承)。
contract named is owned, mortal {
function named(bytes32 name) {
Config config = Config(0xD5f9D8D94886E70b06E474c3fB14Fd43E2f23970);
NameReg(config.lookup(1)).register(name);
}
// 函数可以被另一个具有相同名称和相同数量/类型输入的函数重载。
// 如果重载函数有不同类型的输出参数,会导致错误。
// 本地和基于消息的函数调用都会考虑这些重载。
function kill() public {
if (msg.sender == owner) {
Config config = Config(0xD5f9D8D94886E70b06E474c3fB14Fd43E2f23970);
NameReg(config.lookup(1)).unregister();
// 仍然可以调用特定的重载函数。
mortal.kill();
}
}
}
// 如果构造函数接受参数,
// 则需要在声明(合约的构造函数)时提供,
// 或在派生合约的构造函数位置以修饰器调用风格提供(见下文)。
contract PriceFeed is owned, mortal, named("GoldFeed") {
function updateInfo(uint newInfo) public {
if (msg.sender == owner) info = newInfo;
}
function get() public view returns(uint r) { return info; }
uint info;
}
注意,在上边的代码中,我们调用 mortal.kill() 来“转发”销毁请求。这样做法是有问题的,在下面的例子中可以看到::
pragma solidity ^0.4.0;
contract owned {
function owned() public { owner = msg.sender; }
address owner;
}
contract mortal is owned {
function kill() public {
if (msg.sender == owner) selfdestruct(owner);
}
}
contract Base1 is mortal {
function kill() public { /* 清除操作 1 */ mortal.kill(); }
}
contract Base2 is mortal {
function kill() public { /* 清除操作 2 */ mortal.kill(); }
}
contract Final is Base1, Base2 {
}
调用 Final.kill() 时会调用最远的派生重载函数 Base2.kill,但是会绕过 Base1.kill,主要是因为它甚至都不知道 Base1 的存在。解决这个问题的方法是使用 super:
pragma solidity ^0.4.0;
contract owned {
function owned() public { owner = msg.sender; }
address owner;
}
contract mortal is owned {
function kill() public {
if (msg.sender == owner) selfdestruct(owner);
}
}
contract Base1 is mortal {
function kill() public { /* 清除操作 1 */ super.kill(); }
}
contract Base2 is mortal {
function kill() public { /* 清除操作 2 */ super.kill(); }
}
contract Final is Base1, Base2 {
}
如果 Base2 调用 super 的函数,它不会简单在其基类合约上调用该函数。
相反,它在最终的继承关系图谱的下一个基类合约中调用这个函数,所以它会调用 Base1.kill()(注意最终的继承序列是——从最远派生合约开始:Final, Base2, Base1, mortal, ownerd)。在类中使用 super 调用的实际函数在当前类的上下文中是未知的,尽管它的类型是已知的。
这与普通的虚拟方法查找类似。
基类构造函数的参数
派生合约需要提供基类构造函数需要的所有参数。这可以通过两种方式来完成::
pragma solidity ^0.4.0;
contract Base {
uint x;
function Base(uint _x) public { x = _x; }
}
contract Derived is Base(7) {
function Derived(uint _y) Base(_y * _y) public {
}
}
一种方法直接在继承列表中调用基类构造函数(is Base(7))。另一种方法是像 |modifier| 使用方法一样,作为派生合约构造函数定义头的一部分,(Base(_y * _y))。如果构造函数参数是常量并且定义或描述了合约的行为,使用第一种方法比较方便。如果基类构造函数的参数依赖于派生合约,那么必须使用第二种方法。如果像这个简单的例子一样,两个地方都用到了,优先使用 |modifier| 风格的参数。
多重继承与线性化
编程语言实现多重继承需要解决几个问题。
一个问题是钻石问题
Solidity 借鉴了 Python 的方式并且使用 C3 线性化 强制一个由基类构成的 DAG(有向无环图)保持一个特定的顺序。
这最终反映为我们所希望的唯一化的结果,但也使某些继承方式变为无效。尤其是,基类在 is 后面的顺序很重要。在下面的代码中,Solidity 会给出“ Linearization of inheritance graph impossible ”这样的错误。
// 以下代码编译出错
pragma solidity ^0.4.0;
contract X {}
contract A is X {}
contract C is A, X {}
代码编译出错的原因是 C 要求 X 重写 A (因为定义的顺序是 A, X ),
但是 A 本身要求重写 X,无法解决这种冲突。
可以通过一个简单的规则来记忆:以从“最接近的基类”(most base-like)到“最远的继承”(most derived)的顺序来指定所有的基类。
继承有相同名字的不同类型成员
当继承导致一个合约具有相同名字的函数和 |modifier| 时,这会被认为是一个错误。 当事件和 |modifier| 同名,或者函数和事件同名时,同样会被认为是一个错误。 有一种例外情况,状态变量的 getter 可以覆盖一个 public 函数。
抽象合约
合约函数可以缺少实现,如下例所示(请注意函数声明头由 ; 结尾):
pragma solidity ^0.4.0;
contract Feline {
function utterance() public returns (bytes32);
}
这些合约无法成功编译(即使它们除了未实现的函数还包含其他已经实现了的函数),但他们可以用作基类合约::
pragma solidity ^0.4.0;
contract Feline {
function utterance() public returns (bytes32);
}
contract Cat is Feline {
function utterance() public returns (bytes32) { return "miaow"; }
}
如果合约继承自抽象合约,并且没有通过重写来实现所有未实现的函数,那么它本身就是抽象的。
接口
接口类似于抽象合约,但是它们不能实现任何函数。还有进一步的限制:
- 无法继承其他合约或接口。
- 无法定义构造函数。
- 无法定义变量。
- 无法定义结构体
- 无法定义枚举。
将来可能会解除这里的某些限制。
接口基本上仅限于合约 ABI 可以表示的内容,并且 ABI 和接口之间的转换应该不会丢失任何信息。
接口由它们自己的关键字表示:
pragma solidity ^0.4.11;
interface Token {
function transfer(address recipient, uint amount) public;
}
就像继承其他合约一样,合约可以继承接口。
库
库与合约类似,它们只需要在特定的地址部署一次,并且它们的代码可以通过 EVM 的 DELEGATECALL(Homestead 之前使用 CALLCODE 关键字)特性进行重用。这意味着如果库函数被调用,它的代码在调用合约的上下文中执行,即 this 指向调用合约,特别是可以访问调用合约的存储。因为每个库都是一段独立的代码,所以它仅能访问调用合约明确提供的状态变量(否则它就无法通过名字访问这些变量)。因为我们假定库是无状态的,所以如果它们不修改状态(也就是说,如果它们是 view 或者 pure 函数),库函数仅可以通过直接调用来使用(即不使用 DELEGATECALL 关键字),特别是,除非能规避 Solidity 的类型系统,否则是不可能销毁任何库的。
库可以看作是使用他们的合约的隐式的基类合约。虽然它们在继承关系中不会显式可见,但调用库函数与调用显式的基类合约十分类似(如果 L 是库的话,可以使用 L.f() 调用库函数)。此外,就像库是基类合约一样,对所有使用库的合约,库的 internal 函数都是可见的。
当然,需要使用内部调用约定来调用内部函数,这意味着所有内部类型,内存类型都是通过引用而不是复制来传递。为了在 EVM 中实现这些,内部库函数的代码和从其中调用的所有函数都在编译阶段被拉取到调用合约中,然后使用一个 JUMP 调用来代替 DELEGATECALL。
下面的示例说明如何使用库(但也请务必看看 :ref:using for <using-for> 有一个实现 set 更好的例子)。
pragma solidity ^0.4.16;
library Set {
// 我们定义了一个新的结构体数据类型,用于在调用合约中保存数据。
struct Data { mapping(uint => bool) flags; }
// 注意第一个参数是“storage reference”类型,因此在调用中参数传递的只是它的存储地址而不是内容。
// 这是库函数的一个特性。如果该函数可以被视为对象的方法,则习惯称第一个参数为 `self` 。
function insert(Data storage self, uint value)
public
returns (bool)
{
if (self.flags[value])
return false; // 已经存在
self.flags[value] = true;
return true;
}
function remove(Data storage self, uint value)
public
returns (bool)
{
if (!self.flags[value])
return false; // 不存在
self.flags[value] = false;
return true;
}
function contains(Data storage self, uint value)
public
view
returns (bool)
{
return self.flags[value];
}
}
contract C {
Set.Data knownValues;
function register(uint value) public {
// 不需要库的特定实例就可以调用库函数,
// 因为当前合约就是“instance”。
require(Set.insert(knownValues, value));
}
// 如果我们愿意,我们也可以在这个合约中直接访问 knownValues.flags。
}
当然,你不必按照这种方式去使用库:它们也可以在不定义结构数据类型的情况下使用。函数也不需要任何存储引用参数,库可以出现在任何位置并且可以有多个存储引用参数。
调用 Set.contains,Set.insert 和 Set.remove 都被编译为外部调用( DELEGATECALL )。如果使用库,请注意实际执行的是外部函数调用。msg.sender, msg.value 和 this 在调用中将保留它们的值,(在 Homestead 之前,因为使用了 CALLCODE,改变了 msg.sender 和 msg.value)。
以下示例展示了如何在库中使用内存类型和内部函数来实现自定义类型,而无需支付外部函数调用的开销:
pragma solidity ^0.4.16;
library BigInt {
struct bigint {
uint[] limbs;
}
function fromUint(uint x) internal pure returns (bigint r) {
r.limbs = new uint[](1);
r.limbs[0] = x;
}
function add(bigint _a, bigint _b) internal pure returns (bigint r) {
r.limbs = new uint[](max(_a.limbs.length, _b.limbs.length));
uint carry = 0;
for (uint i = 0; i < r.limbs.length; ++i) {
uint a = limb(_a, i);
uint b = limb(_b, i);
r.limbs[i] = a + b + carry;
if (a + b < a || (a + b == uint(-1) && carry > 0))
carry = 1;
else
carry = 0;
}
if (carry > 0) {
// 太差了,我们需要增加一个 limb
uint[] memory newLimbs = new uint[](r.limbs.length + 1);
for (i = 0; i < r.limbs.length; ++i)
newLimbs[i] = r.limbs[i];
newLimbs[i] = carry;
r.limbs = newLimbs;
}
}
function limb(bigint _a, uint _limb) internal pure returns (uint) {
return _limb < _a.limbs.length ? _a.limbs[_limb] : 0;
}
function max(uint a, uint b) private pure returns (uint) {
return a > b ? a : b;
}
}
contract C {
using BigInt for BigInt.bigint;
function f() public pure {
var x = BigInt.fromUint(7);
var y = BigInt.fromUint(uint(-1));
var z = x.add(y);
}
}
由于编译器无法知道库的部署位置,我们需要通过链接器将这些地址填入最终的字节码中
(请参阅 :ref:commandline-compiler 以了解如何使用命令行编译器来链接字节码)。
如果这些地址没有作为参数传递给编译器,编译后的十六进制代码将包含 __Set______ 形式的占位符(其中 Set 是库的名称)。可以手动填写地址来将那 40 个字符替换为库合约地址的十六进制编码。
与合约相比,库的限制:
- 没有状态变量
- 不能够继承或被继承
- 不能接收以太币
(将来有可能会解除这些限制)
库的调用保护
如果库的代码是通过 CALL 来执行,而不是 DELEGATECALL 或者 CALLCODE 那么执行的结果会被回退,除非是对 view 或者 pure 函数的调用。EVM 没有为合约提供检测是否使用 CALL 的直接方式,但是合约可以使用 ADDRESS 操作码找出正在运行的“位置”。生成的代码通过比较这个地址和构造时的地址来确定调用模式。
更具体地说,库的运行时代码总是从一个 push 指令开始,它在编译时是 20 字节的零。当部署代码运行时,这个常数 被内存中的当前地址替换,修改后的代码存储在合约中。在运行时,这导致部署时地址是第一个被 push 到堆栈上的常数, 对于任何 non-view 和 non-pure 函数,调度器代码都将对比当前地址与这个常数是否一致。
Using For
指令 using A for B; 可用于附加库函数(从库 A)到任何类型(B)。
这些函数将接收到调用它们的对象作为它们的第一个参数(像 Python 的 self 变量)。
using A for *; 的效果是,库 A 中的函数被附加在任意的类型上。在这两种情况下,所有函数都会被附加一个参数,即使它们的第一个参数类型与对象的类型不匹配。
函数调用和重载解析时才会做类型检查。using A for B; 指令仅在当前作用域有效,目前仅限于在当前合约中,后续可能提升到全局范围。通过引入一个模块,不需要再添加代码就可以使用包括库函数在内的数据类型。
让我们用这种方式将libraries中的 set 例子重写::
pragma solidity ^0.4.16;
// 这是和之前一样的代码,只是没有注释。
library Set {
struct Data { mapping(uint => bool) flags; }
function insert(Data storage self, uint value)
public
returns (bool)
{
if (self.flags[value])
return false; // 已经存在
self.flags[value] = true;
return true;
}
function remove(Data storage self, uint value)
public
returns (bool)
{
if (!self.flags[value])
return false; // 不存在
self.flags[value] = false;
return true;
}
function contains(Data storage self, uint value)
public
view
returns (bool)
{
return self.flags[value];
}
}
contract C {
using Set for Set.Data; // 这里是关键的修改
Set.Data knownValues;
function register(uint value) public {
// Here, all variables of type Set.Data have
// corresponding member functions.
// The following function call is identical to
// `Set.insert(knownValues, value)`
// 这里, Set.Data 类型的所有变量都有与之相对应的成员函数。
// 下面的函数调用和 `Set.insert(knownValues, value)` 的效果完全相同。
require(knownValues.insert(value));
}
}
也可以像这样扩展基本类型:
pragma solidity ^0.4.16;
library Search {
function indexOf(uint[] storage self, uint value)
public
view
returns (uint)
{
for (uint i = 0; i < self.length; i++)
if (self[i] == value) return i;
return uint(-1);
}
}
contract C {
using Search for uint[];
uint[] data;
function append(uint value) public {
data.push(value);
}
function replace(uint _old, uint _new) public {
// 执行库函数调用
uint index = data.indexOf(_old);
if (index == uint(-1))
data.push(_new);
else
data[index] = _new;
}
}
注意,所有库调用都是实际的 EVM 函数调用。这意味着如果传递内存或值类型,都将产生一个副本,即使是 self 变量。]使用存储引用变量是唯一不会发生拷贝的情况。
Solidity汇编
Solidity 定义了一种汇编语言,在没有 Solidity 的情况下也可以使用。这种汇编语言也可以嵌入到 Solidity 源代码中当作“内联汇编”使用。 我们从如何使用内联汇编开始,介绍它如何区别于独立汇编语言,然后详细讲述这种汇编语言。
内联汇编
为了实现更细粒度的控制,尤其是为了通过编写库来增强语言,可以利用接近虚拟机的语言将内联汇编与 Solidity 语句结合在一起使用。 由于 EVM 是基于栈的虚拟机,因此通常很难准确地定位栈内插槽(存储位置)的地址,并为操作码提供正确的栈内位置来获取参数。 Solidity 的内联汇编试图通过提供以下特性来解决这个问题以及手工编写汇编代码时可能出现的问题:
- 函数风格操作码:
mul(1, add(2, 3))而不是push1 3 push1 2 add push1 1 mul - 汇编局部变量:
let x := add(2, 3) let y := mload(0x40) x := add(x, y) - 可以访问外部变量:
function f(uint x) public { assembly { x := sub(x, 1) } } - 标签:
let x := 10 repeat: x := sub(x, 1) jumpi(repeat, eq(x, 0)) - 循环:
for { let i := 0 } lt(i, x) { i := add(i, 1) } { y := mul(2, y) } - if 语句:
if slt(x, 0) { x := sub(0, x) } - switch 语句:
switch x case 0 { y := mul(x, 2) } default { y := 0 } - 函数调用:
function f(x) -> y { switch x case 0 { y := 1 } default { y := mul(x, f(sub(x, 1))) } }
现在我们详细讲解内联汇编语言。
内联汇编是一种在底层访问Simplechain虚拟机的语言。这抛弃了很多 Solidity 提供的重要安全特性。
TODO:写出在内联汇编中作用域规则的细微差别,以及在使用库合约的内部函数时产生的复杂性。此外,还要编写有关编译器定义的符号。
例子
下面例子展示了一个库合约的代码,它可以取得另一个合约的代码,并将其加载到一个 bytes 变量中。
这对于“常规 Solidity”来说是根本不可能的,汇编库合约则可以通过这种方式来增强语言特性。
pragma solidity ^0.4.0;
library GetCode {
function at(address _addr) public view returns (bytes o_code) {
assembly {
// 获取代码大小,这需要汇编语言
let size := extcodesize(_addr)
// 分配输出字节数组 – 这也可以不用汇编语言来实现
// 通过使用 o_code = new bytes(size)
o_code := mload(0x40)
// 包括补位在内新的“memory end”
mstore(0x40, add(o_code, and(add(add(size, 0x20), 0x1f), not(0x1f))))
// 把长度保存到内存中
mstore(o_code, size)
// 实际获取代码,这需要汇编语言
extcodecopy(_addr, add(o_code, 0x20), 0, size)
}
}
}
在优化器无法生成高效代码的情况下,内联汇编也可能更有好处。请注意,由于编译器无法对汇编语句进行相关的检查,所以编写汇编代码肯定更加困难; 因此只有在处理一些相对复杂的问题时才需要使用它,并且你需要明确知道自己要做什么。
pragma solidity ^0.4.16;
library VectorSum {
// 因为目前的优化器在访问数组时无法移除边界检查,
// 所以这个函数的执行效率比较低。
function sumSolidity(uint[] _data) public view returns (uint o_sum) {
for (uint i = 0; i < _data.length; ++i)
o_sum += _data[i];
}
// 我们知道我们只能在数组范围内访问数组元素,所以我们可以在内联汇编中不做边界检查。
// 由于 ABI 编码中数组数据的第一个字(32 字节)的位置保存的是数组长度,
// 所以我们在访问数组元素时需要加入 0x20 作为偏移量。
function sumAsm(uint[] _data) public view returns (uint o_sum) {
for (uint i = 0; i < _data.length; ++i) {
assembly {
o_sum := add(o_sum, mload(add(add(_data, 0x20), mul(i, 0x20))))
}
}
}
// 和上面一样,但在内联汇编内完成整个代码。
function sumPureAsm(uint[] _data) public view returns (uint o_sum) {
assembly {
// 取得数组长度(前 32 字节)
let len := mload(_data)
// 略过长度字段。
//
// 保持临时变量以便它可以在原地增加。
//
// 注意:对 _data 数值的增加将导致 _data 在这个汇编语句块之后不再可用。
// 因为无法再基于 _data 来解析后续的数组数据。
let data := add(_data, 0x20)
// 迭代到数组数据结束
for
{ let end := add(data, mul(len, 0x20)) }
lt(data, end)
{ data := add(data, 0x20) }
{
o_sum := add(o_sum, mload(data))
}
}
}
}
语法
和 Solidity 一样,Assembly 也会解析注释、文字和标识符,所以你可以使用通常的 // 和 /* */ 来进行注释。
内联汇编程序由 assembly { ... } 来标记,在这些大括号内可以使用以下内容(更多详细信息请参阅后面部分)。
- 字面常数,也就是
0x123、42或"abc"(不超过 32 个字符的字符串) - 操作码(在“instruction style”内),比如
mload sload dup1 sstore,操作码列表请看后面 - 函数风格操作码,比如
add(1,mlod(0)) - 标签,比如
name: - 变量声明,比如
let x := 7、let x := add(y, 3)或者let x(初始值将被置为 empty(0)) - 标识符(标签或者汇编局部变量以及用作内联汇编时的外部变量),比如
jump(name)、3 x add - 赋值(在“instruction style”内),比如
3 =: x - 函数风格赋值,比如
x := add(y,3) - 一些控制局部变量作用域的语句块,比如
{let x := 3 { let y := add(x,1) }}
操作码
参考操作码:
如果一个操作码需要参数(总是来自堆栈顶部),它们会在括号中给出。请注意:参数顺序可以看作是在非函数风格中逆序(下面会解释)。标有 - 的操作码不会向栈中压入(push)数据,标有 * 的操作码有特殊操作,而所有其他操作码都只会将一个数据压入(push)栈中。
用 F、H、B 或 C 标记的操作码代表它们从 Frontier、Homestead、Byzantium 或 Constantinople 开始被引入。Constantinople 目前仍在计划中,所以标记为 C 的指令目前都会导致一个非法指令异常。在下表中,mem[a...b) 表示从位置 a 开始至(不包括)位置 b 的内存字节数,storage[p] 表示位置 p 处的存储内容。
pushi 和 jumpdest 这两个操作码不能直接用。
在语法表中,操作码是作为预定义标识符提供的。
| Instruction | symbol | Bool | Explanation | |||
|---|---|---|---|---|---|---|
| stop | - |
F | 停止执行,与 return(0,0) 等价 | |||
| add(x, y) | F | x + y | ||||
| sub(x, y) | F | x - y | ||||
| mul(x, y) | F | x * y | ||||
| div(x, y) | F | x / y | ||||
| sdiv(x, y) | F | x / y,以二进制补码作为符号 | ||||
| mod(x, y) | F | x % y | ||||
| smod(x, y) | F | x % y,以二进制补码作为符号 | ||||
| exp(x, y) | F | x 的 y 次幂 | ||||
| not(x) | F | ~x,对 x 按位取反 | ||||
| lt(x, y) | F | 如果 x < y 为 1,否则为 0 | ||||
| gt(x, y) | F | 如果 x > y 为 1,否则为 0 | ||||
| slt(x, y) | F | 如果 x < y 为 1,否则为 0,以二进制补码作为符号 | ||||
| sgt(x, y) | F | 如果 x > y 为 1,否则为 0,以二进制补码作为符号 | ||||
| eq(x, y) | F | 如果 x == y 为 1,否则为 0 | ||||
| iszero(x) | F | 如果 x == 0 为 1,否则为 0 | ||||
| and(x, y) | F | x 和 y 的按位与 | ||||
| or(x, y) | F | x 和 y 的按位或 | ||||
| xor(x, y) | F | x 和 y 的按位异或 | ||||
| byte(n, x) | F | x 的第 n 个字节,这个索引是从 0 开始的 | ||||
| shl(x, y) | C | 将 y 逻辑左移 x 位 | ||||
| shr(x, y) | C | 将 y 逻��右移 x 位 | ||||
| sar(x, y) | C | 将 y 算术右移 x 位 | ||||
| addmod(x, y, m) | F | 任意精度的 (x + y) % m | ||||
| mulmod(x, y, m) | F | 任意精度的 (x * y) % m | ||||
| signextend(i, x) | F | 对 x 的最低位到第 (i * 8 + 7) 进行符号扩展 | ||||
| keccak256(p, n) | F | keccak(mem[p...(p + n))) | ||||
| jump(label) | - |
F | 跳转到标签 / 代码位置 | |||
| jumpi(label, cond) | - |
F | 如果条件为非零,跳转到标签 | |||
| pc | F | 当前代码位置 | ||||
| pop(x) | - |
F | 删除(弹出)栈顶的 x 个元素 | |||
| dup1 ... dup16 | F | 将栈内第 i 个元素(从栈顶算起)复制到栈顶 | ||||
| swap1 ... swap16 | * |
F | 将栈顶元素和其下第 i 个元素互换 | |||
| mload(p) | F | mem[p...(p + 32)) | ||||
| mstore(p, v) | - |
F | mem[p...(p + 32)) := v | |||
| mstore8(p, v) | - |
F | mem[p] := v & 0xff (仅修改一个字节) | |||
| sload(p) | F | storage[p] | ||||
| sstore(p, v) | - |
F | storage[p] := v | |||
| msize | F | 内存大小,即最大可访问内存索引 | ||||
| gas | F | 执行可用的 gas | ||||
| address | F | 当前合约 / 执行上下文的地址 | ||||
| balance(a) | F | 地址 a 的余额,以 wei 为单位 | ||||
| caller | F | 调用发起者(不包括 delegatecall) |
||||
| callvalue | F | 随调用发送的 Wei 的数量 | ||||
| calldataload(p) | F | 位置 p 的调用数据(32 字节) | ||||
| calldatasize | F | 调用数据的字节数大小 | ||||
| calldatacopy(t, f, s) | - |
F | 从调用数据的位置 f 的拷贝 s 个字节到内存的位置 t | |||
| codesize | F | 当前合约 / 执行上下文地址的代码大小 | ||||
| codecopy(t, f, s) | - |
F | 从代码的位置 f 开始拷贝 s 个字节到内存的位置 t | |||
| extcodesize(a) | F | 地址 a 的代码大小 | ||||
| extcodecopy(a, t, f, s) | - |
F | 和 codecopy(t, f, s) 类似,但从地址 a 获取代码 | |||
| returndatasize | B | 最后一个 returndata 的大小 | ||||
| returndatacopy(t, f, s) | - |
B | 从 returndata 的位置 f 拷贝 s 个字节到内存的位置 t | |||
| create(v, p, s) | F | 用 mem[p...(p + s)) 中的代码创建一个新合约、发送 v wei 并返回新地址 | ||||
| create2(v, n, p, s) | C | 用 mem[p...(p + s)) 中的代码,在地址keccak256( . n . keccak256(mem[p...(p + s)))创建新合约、发送 v wei 并返回新地址上 | ||||
| call(g, a, v, in,insize, out, outsize) | F | 使用 mem[in...(in + insize)) 作为输入数据,提供 g gas 和 v wei 对地址 a 发起消息调用,输出结果数据保存在 mem[out...(out + outsize)),发生错误(比如 gas 不足)时返回 0,正确结束返回 1 | ||||
| callcode(g, a, v, in,insize, out, outsize) | F | 与 call 等价,但仅使用地址 a 中的代码 且保持当前合约的执行上下文 |
||||
| delegatecall(g, a, in,insize, out, outsize) | F | 与 callcode 等价且保留 caller 和 callvalue |
||||
| staticcall(g, a, in,insize, out, outsize) | F | 与 call(g, a, 0, in, insize, out, outsize) 等价,但不允许状态修改 |
||||
| return(p, s) | - |
F | 终止运行,返回 mem[p...(p + s)) 的数据 | |||
| revert(p, s) | - |
B | 终止运行,撤销状态变化,返回 mem[p...(p + s)) 的数据 | |||
| selfdestruct(a) | - |
F | 终止运行,销毁当前合约并且把资金发送到地址 a | |||
| invalid | - |
F | 以无效指令终止运行 | |||
| log0(p, s) | - |
F | 以 mem[p...(p + s)) 的数据产生不带 topic 的日志 | |||
| log1(p, s, t1) | - |
F | 以 mem[p...(p + s)) 的数据和 topic t1 产生日志 | |||
| log2(p, s, t1, t2) | - |
F | 以 mem[p...(p + s)) 的数据和 topic t1、t2 产生日志 | |||
| log3(p, s, t1, t2, t3) | - |
F | 以 mem[p...(p + s)) 的数据和 topic t1、t2、t3 产生日志 | |||
| log4(p, s, t1, t2, t3, t4) | - |
F | 以 mem[p...(p + s)) 的数据和 topic t1、t2、t3 和 t4 产生日志 | |||
| origin | F | 交易发起者地址 | ||||
| gasprice | F | 交易所指定的 gas 价格 | ||||
| blockhash(b) | F | 区块号 b 的哈希 - 目前仅适用于不包括当前区块的最后 256 个区块 | ||||
| coinbase | F | 当前的挖矿收益者地址 | ||||
| timestamp | F | 从当前 epoch 开始的当前区块时间戳(以秒为单位) | ||||
| number | F | 当前区块号 | ||||
| difficulty | F | 当前区块难度 | ||||
| gaslimit | F | 当前区块的 gas 上限 | ||||
字面常量
你可以直接键入十进制或十六进制符号来作为整型常量使用,这会自动生成相应的 PUSHi 指令。
下面的代码将计算 2 加 3(等于 5),然后计算其与字符串 “abc” 的按位与。字符串在存储时为左对齐,且长度不能超过 32 字节。
assembly { 2 3 add "abc" and }
函数风格
你可以像使用字节码那样在操作码之后键入操作码。例如,把 3 与内存位置 0x80 处的数据相加就是
3 0x80 mload add 0x80 mstore
由于通常很难看到某些操作码的实际参数是什么,所以 Solidity 内联汇编还提供了一种“函数风格”表示法,同样功能的代码可以写做
mstore(0x80, add(mload(0x80), 3))
函数风格表达式内不能使用指令风格的写法,即 1 2 mstore(0x80, add) 是无效汇编语句,
它必须写成 mstore(0x80, add(2, 1)) 这种形式。对于不带参数的操作码,括号可以省略。
注意,在函数风格写法中参数的顺序与指令风格相反。如果使用函数风格写法,第一个参数将会位于栈顶。
访问外部变量和函数
通过简单使用它们名称就可以访问 Solidity 变量和其他标识符。对于内存变量,这会将地址而不是值压入栈中。
存储变量是不同的,因为存储变量的值可能不占用完整的存储槽,因此其“地址”由存储槽和槽内的字节偏移量组成。
为了获取变量 x 所使用的存储槽,你可以使用 x_slot,并用的 x_offset 获取其字节偏移量。
在赋值语句中(见下文),我们甚至可以使用 Solidity 局部变量来赋值。
对于内联汇编而言的外部函数也可以被访问:汇编会将它们的入口标签(带有虚拟函数解析)压入栈中。Solidity 中的调用语义为:
- 调用者压入
return label、arg1、arg2、...、argn - 被调用方返回
ret1、ret2、...、retm
这个特性使用起来还是有点麻烦,因为在调用过程中堆栈偏移量发生了根本变化,因此对局部变量的引用将会出错。
pragma solidity ^0.4.11;
contract C {
uint b;
function f(uint x) public returns (uint r) {
assembly {
r := mul(x, sload(b_slot)) // 因为偏移量为 0,所以可以忽略
}
}
}
如果你访问一个实际数据位数小于 256 位的数据类型(比如
uint64、address、bytes16或byte),不要对这种类型经过编码后未使用的数据位上的数值做任何假设。尤其是不要假设它们肯定为 0。安全起见,在某个上下文中使用这种数据之前,请一定先将其数据清空为 0,这非常重要:uint32 x = f(); assembly { x := and(x, 0xffffffff) /* now use x */ }要清空有符号类型,你可以使用signextend操作码。
标签
标签已经不推荐使用。请使用函数、循环、if 或 switch 语句。
EVM 汇编的另一个问题是 jump 和 jumpi 函数使用绝对地址,这些绝对地址很容易改变。 Solidity 内联汇编提供了标签,以便更容易地使用 jump。注意,标签具有底层特征,使用循环、if 和 switch 指令(参见下文)而不使用标签也能写出高效汇编代码。 以下代码用来计算斐波那契数列中的一个元素。
{
let n := calldataload(4)
let a := 1
let b := a
loop:
jumpi(loopend, eq(n, 0))
a add swap1
n := sub(n, 1)
jump(loop)
loopend:
mstore(0, a)
return(0, 0x20)
}
请注意:只有汇编程序知道当前栈高度时,才能自动访问堆栈变量。如果 jump 源和目标的栈高度不同,访问将失败。 虽然我们可以这么使用 jump,但在这种情况下,你不应该去访问任何栈里的变量(即使是汇编变量)。
此外,栈高度分析器还可以通过操作码(而不是根据控制流)检查代码操作码,因此在下面的情况下,汇编程序对标签 two 处的堆栈高度会产生错误的印象:
{
let x := 8
jump(two)
one:
// 这里的栈高度是 2(因为我们压入了 x 和 7),
// 但因为汇编程序是按顺序读取代码的,
// 它会认为栈高度是 1。
// 在这里访问栈变量 x 会导致错误。
x := 9
jump(three)
two:
7 // 把某个数据压入栈中
jump(one)
three:
}
汇编局部变量声明
你可以使用 let 关键字来声明只在内联汇编中可见的变量,实际上只在当前的 {...} 块中可见。
下面发生的事情应该是:let 指令将创建一个为变量保留的新数据槽,并在到达块末尾时自动删除。
你需要为变量提供一个初始值,它可以只是 0,但它也可以是一个复杂的函数风格表达式。
pragma solidity ^0.4.16;
contract C {
function f(uint x) public view returns (uint b) {
assembly {
let v := add(x, 1)
mstore(0x80, v)
{
let y := add(sload(v), 1)
b := y
} // y 会在这里被“清除”
b := add(b, v)
} // v 会在这里被“清除”
}
}
赋值
可以给汇编局部变量和函数局部变量赋值。请注意:当给指向内存或存储的变量赋值时,你只是更改指针而不是数据。
有两种赋值方式:函数风格和指令风格。对于函数风格赋值(变量 := 值),你需要在函数风格表达式中提供一个值,它恰好可以产生一个栈里的值;
对于指令风格赋值(=: 变量),则仅从栈顶部获取数据。对于这两种方式,冒号均指向变量名称。赋值则是通过用新值替换栈中的变量值来实现的。
{
let v := 0 // 作为变量声明的函数风格赋值
let g := add(v, 2)
sload(10)
=: v // 指令风格的赋值,将 sload(10) 的结果赋给 v
}
指令风格的赋值已经不推荐。
If
if 语句可以用于有条件地执行代码,且没有“else”部分;如果需要多种选择,你可以考虑使用“switch”(见下文)。
{
if eq(value, 0) { revert(0, 0) }
}
代码主体的花括号是必需的。
Switch
作为“if/else”的非常初级的版本,你可以使用 switch 语句。它计算表达式的值并与几个常量进行比较。选出与匹配常数对应的分支。
与某些编程语言容易出错的情况不同,控制流不会从一种情形继续执行到下一种情形。我们可以设定一个 fallback 或称为 default 的默认情况。
{
let x := 0
switch calldataload(4)
case 0 {
x := calldataload(0x24)
}
default {
x := calldataload(0x44)
}
sstore(0, div(x, 2))
}
Case 列表里面不需要大括号,但 case 主体需要。
循环
汇编语言支持一个简单的 for-style 循环。For-style 循环有一个头,它包含初始化部分、条件和迭代后处理部分。 条件必须是函数风格表达式,而另外两个部分都是语句块。如果起始部分声明了某个变量,这些变量的作用域将扩展到循环体中(包括条件和迭代后处理部分)。
下面例子是计算某个内存区域中的数值总和。
{
let x := 0
for { let i := 0 } lt(i, 0x100) { i := add(i, 0x20) } {
x := add(x, mload(i))
}
}
For 循环也可以写成像 while 循环一样:只需将初始化部分和迭代后处理两部分留空。
{
let x := 0
let i := 0
for { } lt(i, 0x100) { } { // while(i < 0x100)
x := add(x, mload(i))
i := add(i, 0x20)
}
}
函数
汇编语言允许定义底层函数。底层函数需要从栈中取得它们的参数(和返回 PC),并将结果放入栈中。调用函数的方式与执行函数风格操作码相同。函数可以在任何地方定义,并且在声明它们的语句块中可见。函数内部不能访问在函数之外定义的局部变量。这里没有严格的 return 语句。如果调用会返回多个值的函数,则必须使用 a,b:= f(x) 或 let a,b:= f(x) 的方式把它们赋值到一个元组。
下面例子通过平方和乘法实现了幂运算函数。
{
function power(base, exponent) -> result {
switch exponent
case 0 { result := 1 }
case 1 { result := base }
default {
result := power(mul(base, base), div(exponent, 2))
switch mod(exponent, 2)
case 1 { result := mul(base, result) }
}
}
}
注意事项
内联汇编语言可能具有相当高级的外观,但实际上它是非常低级的编程语言。函数调用、循环、if 语句和 switch 语句通过简单的重写规则进行转换, 然后,汇编程序为你做的唯一事情就是重新组织函数风格操作码、管理 jump 标签、计算访问变量的栈高度,还有在到达语句块末尾时删除局部汇编变量的栈数据。 特别是对于最后两种情况,汇编程序仅会按照代码的顺序计算栈的高度,而不一定遵循控制流程;了解这一点非常重要。此外,swap 等操作只会交换栈内的数据,而不是变量位置。
Solidity 惯例
与 EVM 汇编语言相比,Solidity 能够识别小于 256 位的类型,例如 uint24。为了提高效率,大多数算术运算只将它们视为 256 位数字,仅在必要时才清除未使用的数据位,即在将它们写入内存或执行比较之前才会这么做。这意味着,如果从内联汇编中访问这样的变量,你必须先手工清除那些未使用的数据位。
Solidity 以一种非常简单的方式管理内存:在 0x40 的位置有一个“空闲内存指针”。如果你打算分配内存,只需从此处开始使用内存,然后相应地更新指针即可。内存的开头 64 字节可以用来作为临时分配的“暂存空间”。“空闲内存指针”之后的 32 字节位置(即从 0x60 开始的位置)将永远为 0,可以用来初始化空的动态内存数组。
在 Solidity 中,内存数组的元素总是占用 32 个字节的倍数(是的,甚至对于 byte[] 都是这样,只有 bytes 和 string 不是这样)。多维内存数组就是指向内存数组的指针。动态数组的长度存储在数组的第一个槽中,其后才是数组元素。
静态内存数组没有长度字段,但很快就会增加,这是为了可以更好地进行静态数组和动态数组之间的转换,所以请不要依赖这点。
独立汇编
以上内联汇编描述的汇编语言也可以单独使用,实际上,计划是将其用作 Solidity 编译器的中间语言。在这种意义下,它试图实现以下几个目标:
1、即使代码是由 Solidity 的编译器生成的,用它编写的程序应该也是可读的。 2、从汇编到字节码的翻译应该尽可能少地包含“意外”。 3、控制流应该易于检测,以帮助进行形式化验证和优化。
为了实现第一个和最后一个目标,汇编提供了高级结构:如 for 循环、if 语句、switch 语句和函数调用。
应该可以编写不使用明确的 SWAP、DUP、JUMP 和 JUMPI 语句的汇编程序,因为前两个混淆了数据流,而最后两个混淆了控制流。
此外,形式为 mul(add(x, y), 7) 的函数风格语句优于如 7 y x add mul 的指令风格语句,因为在第一种形式中更容易查看哪个操作数用于哪个操作码。
第二个目标是通过采用一种非常规则的方式来将高级高级指令结构便以为字节码。 汇编程序执行的唯一非局部操作是用户自定义标识符(函数、变量、...)的名称查找,它遵循非常简单和固定的作用域规则并从栈中清除局部变量。
作用域:在其中声明的标识符(标签、变量、函数、汇编)仅在声明的语句块中可见(包括当前语句块中的嵌套语句块)。 即使它们在作用范围内,越过函数边界访问局部变量也是非法的。阴影化是禁止的。在声明之前不能访问局部变量,但标签、函数和汇编是可以的。 汇编是特殊的语句块,例如用于返回运行时代码或创建合约等。在子汇编外部的汇编语句块中声明的标示符在子汇编中全都不可见。
如果控制流经过块尾部,则会插入与在当前语句块中声明的局部变量数量相匹配的 pop 指令。无论何时引用局部变量,代码生成器都需要知道在当前栈的相对位置, 因此,需要跟踪当前所谓的栈高度。由于所有在语句块内声明的局部变量都会在语句块结束时被清楚,所以语句块前后的栈高度应该相同。如果情况并非如此,则会发出警告。
使用 switch、for 和函数应该可以编写复杂的代码,而无需手工调用 jump 或 jumpi。这将允许改进的形式化验证和优化更简单地分析控制流程。
此外,如果允许手动跳转,计算栈高度将会更加复杂。栈中所有局部变量的位置都需要明确知晓,否则在语句块结束时就无法自动获得局部变量的引用从而正确地清除它们。
例子:
我们将参考一个从 Solidity 到汇编指令的实例。考虑以下 Solidity 程序的运行时字节码::
pragma solidity ^0.4.16;
contract C {
function f(uint x) public pure returns (uint y) {
y = 1;
for (uint i = 0; i < x; i++)
y = 2 * y;
}
}
将会生成如下汇编指令::
{
mstore(0x40, 0x60) // 保存“空闲内存指针”
// 函数选择器
switch div(calldataload(0), exp(2, 226))
case 0xb3de648b {
let r := f(calldataload(4))
let ret := $allocate(0x20)
mstore(ret, r)
return(ret, 0x20)
}
default { revert(0, 0) }
// 内存分配器
function $allocate(size) -> pos {
pos := mload(0x40)
mstore(0x40, add(pos, size))
}
// 合约函数
function f(x) -> y {
y := 1
for { let i := 0 } lt(i, x) { i := add(i, 1) } {
y := mul(2, y)
}
}
}
汇编语法
解析器任务如下:
- 将字节流转换为符号流,丢弃 C ++ 风格的注释(对源代码引用存在特殊注释,我们这里不解释它)。
- 根据下面的语法,将符号流转换为 AST。
- 注册语句块中定义的标识符(注释到 AST 节点),并注明变量从哪个地方开始可以访问。
汇编词法分析器遵循由 Solidity 自己定义的规则。
空格用于分隔所有符号,它由空格字符、制表符和换行符组成。注释格式是常规的 JavaScript/C++ 风格,并被解释为空格。
Grammar::
AssemblyBlock = '{' AssemblyItem* '}'
AssemblyItem =
Identifier |
AssemblyBlock |
AssemblyExpression |
AssemblyLocalDefinition |
AssemblyAssignment |
AssemblyStackAssignment |
LabelDefinition |
AssemblyIf |
AssemblySwitch |
AssemblyFunctionDefinition |
AssemblyFor |
'break' |
'continue' |
SubAssembly
AssemblyExpression = AssemblyCall | Identifier | AssemblyLiteral
AssemblyLiteral = NumberLiteral | StringLiteral | HexLiteral
Identifier = [a-zA-Z_$] [a-zA-Z_0-9]*
AssemblyCall = Identifier '(' ( AssemblyExpression ( ',' AssemblyExpression )* )? ')'
AssemblyLocalDefinition = 'let' IdentifierOrList ( ':=' AssemblyExpression )?
AssemblyAssignment = IdentifierOrList ':=' AssemblyExpression
IdentifierOrList = Identifier | '(' IdentifierList ')'
IdentifierList = Identifier ( ',' Identifier)*
AssemblyStackAssignment = '=:' Identifier
LabelDefinition = Identifier ':'
AssemblyIf = 'if' AssemblyExpression AssemblyBlock
AssemblySwitch = 'switch' AssemblyExpression AssemblyCase*
( 'default' AssemblyBlock )?
AssemblyCase = 'case' AssemblyExpression AssemblyBlock
AssemblyFunctionDefinition = 'function' Identifier '(' IdentifierList? ')'
( '->' '(' IdentifierList ')' )? AssemblyBlock
AssemblyFor = 'for' ( AssemblyBlock | AssemblyExpression )
AssemblyExpression ( AssemblyBlock | AssemblyExpression ) AssemblyBlock
SubAssembly = 'assembly' Identifier AssemblyBlock
NumberLiteral = HexNumber | DecimalNumber
HexLiteral = 'hex' ('"' ([0-9a-fA-F]{2})* '"' | '\'' ([0-9a-fA-F]{2})* '\'')
StringLiteral = '"' ([^"\r\n\\] | '\\' .)* '"'
HexNumber = '0x' [0-9a-fA-F]+
DecimalNumber = [0-9]+