此手册记载Template:Ll的文档,它用于MediaWiki的Template:Ll扩展。 部分内容(英文原文)取自Lua 5.1参考手册。
在已启用Scribunto的MediaWiki wiki上,以“Module:”前缀为标题创建一个页面,例如“Module:Bananas”。 进入该新页面,复制下列文本:
local p = {} --p代表包(package) function p.hello( frame ) return "Hello, world!" end return p
保存之后,另一个非模块的页面将会写入:
{{#invoke:Bananas|hello}}
除了你应该将“Bananas”替换成你需要调用的模块。这将会使“hello”函数被模块调用。{{#invoke:Bananas|hello}}
将会被函数输出的结果替换,那么,“Hello, world!”
从模板的内容调用Lua代码确实是一个好办法。 这意味着从调用页面的角度来说,语法不依赖与模板逻辑是否被Lua或者维基文本执行。 这也避免了把复杂语法加到wiki内容页面中。
模块本身必须返回一个包含能被{{#invoke:}}
调用的函数的表(table)。
一般来说,如上所示,先声明一个局部变量表,函数被写在这个表中,并模块代码的结尾返回(return)这个表。
任何没有加到这个表中的函数,无论是局部(变量)还是全局(变量),都不能被{{#invoke:}}
关联,但是局部变量可能会被其他的用require()
加载的模块关联。
对于模块来说,最好将所有的函数和变量声明为局部变量。
被{{#invoke:}}
调用函数时,会将框架对象(frame object)作为单一的参数用于调用。要关联被{{#invoke:}}
通过的函数,代码通常会使用框架项目的args
表。也可以关联被包含{{#invoke:}}
的模板参数,方法是使用frame:getParent()
然后关联到框架的args
。
框架项目也用来关联特定情况下的维基文本解析器,例如调用解析器函数、扩展模板以及展开任意的(含模板或解析器函数的)维基文本字符串。
模块函数通常返回单个的字符串;无论返回什么值都会通过tostring()转换,然后连接在一起。这个字符串就是转化成维基文本代码{{#invoke:}}
的结果。
在解析页面的这一点上,模板都是已经被展开的,解析器函数和扩展标签都已经被处理,而且预存的转换(例如签名的扩展以及pipe trick)都已经完成。因此,模块不能在输出文本中使用这些特性。例如,如果一个模块返回"Hello, [[world]]! {{welcome}}"
,页面就会显示“Hello, world! {{welcome}}”。
另一方面,替换引用会在加工的早期阶段被处理,所以只有当其他尝试的替换引用会被处理时才使用{{subst:#invoke:}}
。因为失败的替换引用会保持为维基文本,所以它们都会被下一次编辑处理。这得要避免。
Scruibunto允许模块可以被自动关联的模块维基文本页面关联文档;默认情况下,模块的“/doc”子页面是用来作为文档,并且会在模块页面的代码顶部显示其内容。例如,“模块:Bananas”的文档页面就是“模块:Bananas/doc”。
这也可以使用以下MediaWiki名字空间下的消息配置:
scribunto-doc-page-name
—设置用来作文档页面的名称。 模块(除了模块:prefix)的名称会通过$1
。 如果在模块名字空间,这里的页面通常会视为维基文本而不是Lua代码,也不会被{{#invoke:}}
使用。 模块的页面通常是“Module:$1/doc”这样的模块/doc子页面。注意解析器函数等其他可扩展代码在这个消息中不被使用。 请注意,此消息中解析器函数和其他大括号扩展可能无法使用。scribunto-doc-page-does-not-exist
— 文档页面不存在时显示的消息。 页面名称传递为$1
。 默认为空。scribunto-doc-page-show
— 文档页面存在时显示的消息。 页面名称传递为$1
。 默认是transclude文档页面。scribunto-doc-page-header
— 查看文档页面本身时显示的标题。 模块的名称(有Module:前缀)传递为$1
。 默认以斜体显示简要说明。注意模块不可以被直接分类,也不可以直接添加跨维基链接。 这些应该放在文档页面里面的Template:Tag标签中,当文档页面被引用到模块页面时,这些分类和跨维基链接就会应用于模块页面。
Lua中的名称(names)(也叫标识符(identifiers))通常可以是任何字母、数字和下划线的字符串,但不可以以数字开头。名称区分大小写;“foo”“Foo”和“FOO”都是不同的名称。
下列关键字是保留的,不能用作名称:
and
break
do
else
elseif
end
false
for
function
if
in
local
nil
not
or
repeat
return
then
true
until
while
以下划线开头后面接大写字母的名称是留给内部的Lua全局变量的。
下面这些文本也属于保留字:
#
%
(
)
*
+
,
-
.
..
...
/
:
;
<
<=
=
==
>
>=
[
]
^
{
}
~=
注释在任何地方(除了字符串内)由--
开始。如果--
紧接着开放的中括号,注释就会一直延伸到下一个中括号;否则注释会延伸到这一行的结尾。
-- Lua的注释是由两个连字符(<code>-</code>)开始,延续到一行末尾。 --[[ 多行的字符串和注释 可以被两层中括号括起来。]] --[=[ 像这样的注释可以紧随其他--[[注释]]。]=] --[==[ 像这样的注释可以有其他的 --[===[ 修长的 --[=[注释]=] --跟随着 ]===] 多次,即使它们所有 --[[ 都没有用匹配的长括号分隔! ]===] ]==]
Lua是动态类型语言,意味着变量和函数值都不会有种类,只有值会有。所有的值都有类型。
Lua有8个基本类型,然而只有6个是与Scribunto扩展相关。type()
函数会返回值的类型。
tostring()
能够将值转化为字符串(string)。tonumber()
能够将值转化为数字(number)(如果可能的话),而其他情况则会返回空值(nil)。没有用于将一个值转化为其他的数据类型的明确的函数。
凡是将与字符串(string)连接在一起的地方,数字(number)会自动转化为字符串。使用计算符号时,字符串会由tonumber()
自动转化为数字辨识。当运算中需要将一个值作为布尔值(boolean)时,除了nil和false之外,所有的值都会视为true。
“空值”是nil
的数据类型,用来表示这个值不存在。
空值不能用作表(table)中的键(key),而且表中某个域“未指定”与“值为nil”没有区别。
当空值转化为字符串时,其结果会是“nil”;转化为布尔值(boolean)时,空值会被视为false。
布尔值就是true
(真)和false
(假)。
当布尔值转化为字符串时,结果就是“true”或者“false”。
不像很多其他语言,布尔值不会直接转化为数字。而且只有false和nil作为布尔值时也会视为false;数字0和空字符串都是视为true。
Lua字符串会视为一系列的8比特字节;这取决于应用程序以哪种特定的编码来解析。
字符串会记录在任何一组单双引号('
或"
)中;就像JavaScript而不像PHP,这两者(指的单引号和双引号)无区别。以下转义序列能被识别:
\a
(响铃,字节7)\b
(退格,字节8)\t
(水平制表符,字节9)\n
(换行,字节10)\v
(纵向制表符,字节11)\f
(换页,字节12)\r
(回车,字节13)\"
(双引号,字节34)\'
(单引号,字节39)\\
(反斜线,字节92)在字符串代码中直接换行,应该在前面加一个反斜线(\)。字节也可以通过转义序列'\ddd',这样ddd是0~255中的字节值。使用转义序列来代替Unicode字符,则为UTF-8的单个编码字节必须要指定;总的来说,直接输入Unicode字符会更加简单。
字符串也可以用长括号定义。
长括号之间可以夹杂着0个或更多个等号(两边的等号要等量),例如[[
、[=[
或[=====[
。
开放的长括号必须被相应的闭合的长括号(或者说是结束标记)链接,例如]]
、]=]
或者]=====]
.。
特殊情况下,开放的长括号紧跟着连续换行但未被包括的字符串,新一行只会持续到闭合长括号前。
由长括号定义的字符串不会处理转义序列。
-- 长字符串 foo = [[ bar\tbaz ]] -- 等效于此引号分隔的字符串 foo = 'bar\\tbaz\n'
注意,在转化为布尔值时,所有的字符串都会视为true(真)。这不像其他的语言将空字符串视为false(假)。
Lua只有一种数字类型,就是典型的双精度浮点数。这种格式下,-9007199254740992到9007199254740992之间的整数都会准确表达,更大的数和带有小数部分的数将会受到舍入的误差。
数字可以用点(.
)来表示小数,例如123456.78
。数字也可以用不带空格的科学计数法,例如1.23e-10
、123.45e20
或者1.23E5
。也可以用16进制表示整数,方法就是以0x
开头,例如0x3A
。
虽然NaN和正负无穷大都可以正确地储存、处理,但是Lua不提供相应的直接文字表示方法。math.huge
是正无穷大,相当于1/0
,此外,像0/0
这样的除法就可以生成NaN。
重申一遍,在转化为布尔值时,任何数字都会被视为true。这不像其他语言,数字0通常视为false。数字在转化为字符串时,数字都会被视为有限小数和科学计数;NaN是<syntaxhighlight lang="lua" inline>"nan"或者<syntaxhighlight lang="lua" inline>"-nan";无穷大就是<syntaxhighlight lang="lua" inline>"inf"或<syntaxhighlight lang="lua" inline>"-inf"。
Lua的表是关联数组(associative arrays),很像PHP的数组和JavaScript的对象(object)。
表要用一对花括号创建。空表是{}
。创建有多个域的表时,逗号和分号可以分隔表中的各个域。表的内容可以用以下形式表示:
[表达式1] = 表达式2
,意思是键为表达式1,它与值表达式2匹配。即表达式1的值是表达式2。名称 = 表达式
,它等价于["名称"] = 表达式
。表达式
大致相当于[i] = 表达式
,在这里i是在这个表中从1开始排序的正整数。如果最后一个字段和表达式有多个值,所有的值都会使用;否则只有第一个会保留。表中的域用中括号访问,例如table[key]
。字符串键(key)同样也可以用作点来表示的名字,例如table.key
就与table['key']
等价。调用表中的一个函数也可以用冒号,例如table:func( ... )
,相当于table['func']( table, ... )
或者table.func( table, ... )
。
序列(sequence)是从1到N的所有正整数且没有比N更大的正整数、且非空值的表。很多Lua函数仅会操作序列,忽略所有的非正整数的键。
不像很多其他的语言(例如PHP或JavaScript),在Lua任何值(除了nil和NaN)都可以作为键,而且不会执行类型转换。参看下面的示例:
-- 创建表 t = {} t["foo"] = "foo" t.bar = "bar" t[1] = "一" t[2] = "二" t[3] = "三" t[12] = "数字十二" t["12"] = "字符串十二" t[true] = "true" t[tonumber] = "是的,即使函数也可以用作表格键" t[t] = "是的,表格也可以用作表格的键,即使是它本身。" -- 这将创建一个大致相当于上面的表 t2 = { foo = "foo", bar = "bar", "一", "二", [12] = "数字十二", ["12"] = "字符串十二", "三", [true] = "true", [tonumber] = "是的,即使函数也可以用作表格键", } t2[t2] = "是的,表格也可以用作表格的键,即使是它本身。"
类似地,任何非nil的值都可以在表中储存为值。将表中存储nil相当于删除表中的对应的键,并且调用表中任何一个不存在的键都会返回nil。
注意,在Lua中,表从来不会复制出一个独立的新表;如果表作为一个参数传递到函数,那么函数能修改表中的键或值,这些变化在调用者(caller)的作用域中都会可见。
当转化为字符串时,结果通常是"table",但使用__tostring
元方法可以重写这个转化方法。作为布尔值时,即使是空的表也会视为真(true)。
Lua中的函数是一等的(first-class)的值:可以匿名创建,或作为参数传递,或给变量赋值,等等。
函数通过function
(“函数”的英文)关键字,并使用圆括号调用。有一些语法糖可以用来命名函数,局部函数,并且可以作为表中的一个域值。参看函数声明和函数调用。
Lua函数是闭包,这意味着它们维护对它们声明的作用域的引用,并可以访问和操作该作用域中的变量。
类似于表,如果函数一个函数被分配给另一个变量,或者作为参数传递给另一个函数,它仍然是相同的被调用的底层“函数对象”。
函数转化为字符串时,结果是"function"。
用户数据(userdata)用来储存其他语言中的值;例如,一个用户数据可以用来储存C的指针或结构。使用Scribunto运行环境不允许使用用户数据。
线程数据类型代表协同处理,在Scribunto的沙盒中不可用。
每个表都可以关联另一个表,成为元表(metatable)。元表的字段将由特定的操作符或函数使用,从而为表指定不同的或者回落的行为。表的元表通过getmetatable()函数获取,通过setmetatable()函数设置。
访问元函数时,会像rawget()这样访问元表字段。
以下元表字段可以影响表本身:
t[key]
返回nil就使用这个。 如果这个字段的值是表,访问就会在这个表中重复进行,例如__index[键]
(会调用这个表的元表的__index)。 如果这个字段的值是函数,函数就会像__index( t, 键 )
这样调用。 rawget()函数会绕过这个元方法。t[键]=值
,但是rawget( t, 键 )
会返回空值(nil)。 如果这个字段的值是表,赋值就会在这个表中重复进行,例如__newindex[键] = 值
(会调用这个表的元表的__newindex)。 如果这个字段的值是函数,那么函数就会像这样调用:__newindex( t, 键, 值)
。 rawset()函数会绕过这个元方法。t( ... )
时,就会使用这个元方法。 这个值必须是函数,会像__call( t, ··· )
这样调用。其他元表字段包括:
注意:在Lua中,所有的字符串都会共用一个单一的元表,其__index
就是指的string
表。在Scribunto中,这个元表不允许访问,也不能被string
表引用;对模块可用的string表是一个副本。
变量是储存值的地方。Lua有三种变量:全局(global)变量、局部(local)变量和表(table)中的域(field)。
名称分为全局和局部变量(或者是函数变量,是局部变量的一种)。定义一个局部变量,可以使用关键词local
,否则默认视为全局变量。任何没有赋值的变量都会视为有nil值。
全局变量储存在叫做环境的Lua表中;这个表通常是作为全局变量_G
的值。这个全局变量表也可以设置元表;__index和__newindex元方法都可以用于全局变量表,就像其他的表一样。
函数的环境可以使用getfenv()函数获取,使用setfenv()函数修改;在Scribunto中,这些函数如果全部可用,就会受到严重限制。
局部变量是有词法作用域的;参见局部变量定义了解详细信息。
表达式是有值的:字面量(数字、字符串、真、假、空值)、匿名函数声明、表构造函数、变量引用、函数调用、变量参数表达式、用括号括起来的表达式、一进制和二进制运算的表达式。
大多数表达式都有一个值;函数调用和变量参数表达式可以有任何数量个值。注意用括号括一个函数调用或变量参数表达式只能保留第一个值,其他的值会失去。
exp-list 表达式列表是逗号分隔的表达式列表。除了最后一个表达式以外,所有的值都只能是一个值(如果表达式没有值,则丢弃附加值,或者使用nil);最后一个表达式的所有值都包含在表达式列表的值中。
Lua支持以下常见的算数运算符:加减乘除、模运算、幂和取反。
当所有操作值为数字或字符串时,即使用tonumber()返回非nil时,这些操作符有他们通常的意义。
如果一个操作数是一个有合适的元方法的表,元方法就会被调用。
操作 | 功能 | 示例 | 元方法 | 注释 |
---|---|---|---|---|
+ | 加法 | a + b | __add | |
- | 减法 | a - b | __sub | |
* | 乘法 | a * b | __mul | |
/ | 除法 | a / b | __div | 除以零不会出错,会返回NaN或者无穷大 |
% | 模运算 | a % b | __mod | 定义为a % b == a - math.floor( a / b ) * b
|
^ | 幂运算 | a ^ b | __pow | 允许非整数指数 |
- | 取相反数 | -a | __unm |
Lua的关系运算符是==
、~=
、<
、>
、<=
和>=
。关系运算的结果一定是布尔值(boolean)。
等于号(==
)首先比较两个值的种类;如果两个值是不同的种类,结果为假(false)。然后比较值:空值、布尔值、数字和字符串照常比较。对于函数,则是看两个函数是否引用同一个准确的函数对象;像这样检测两个不同的(但作用相同的)匿名函数function() end == function() end
一定会返回假(false)。表也会默认像函数这样比较,但是可能会由于使用__eq元方法而改变结果。
不等号(~=
)与等于号作用相反。
对于排序运算符,如果两者都是数字,或者两者都是字符串,则直接进行比较。其次检查元方法:
a < b
使用__lt
a <= b
使用__le
如果可用,或者__lt
可用,那么它等价于not ( b < a )
a > b
等价于b < a
a >= b
等价于b <= a
如果必需的元方法不可用,会产生错误。
逻辑运算是and
(与)、or
(或)和not
(非)。在逻辑运算中,只有空值(nil)和false被视为false,其他的都被视为true。
对于and
,如果左边的操作数被视为假,那么被返回这个操作数,将右边的操作数忽略;否则返回右边的操作数。
对于or
,如果左边的操作数视为真,那么返回左边的操作数,忽略右边的操作数;否则返回右边的操作数。
对于not
,其结果一定是布尔值(true或false)。
注意由and
和or
组成的简短语句。例如,foo() or bar()
只会调用bar()
,除非foo()
不是在它的返回false或nil。
连接运算符就是两个点(dot),比如a .. b
。如果两个操作数都是数字或字符串,它们会被转化为字符串然后返回。但是如果__concat元方法可用,就会使用这样的元方法。如果它存在但无效,则会产生错误。
注意Lua的字符串是不可变的(immutable),而且Lua不提供任何类型的“字符串构造器(string builder)”,所以反复进行a = a .. b
会必须为每次迭代创建一个新字符串,并最终将旧字符串作为垃圾收集。如果许多字符串都需要连接,则应使用string.format(),或将所有的字符串添加到一个序列然后最后使用table.concat()连接。
长度运算符是#
,像#a
这样使用。如果a
是字符串,会返回字符串的字节长度。如果a
是序列表,会返回序列的长度。
如果a
是一个不是序列的表,#a
会返回能够使“a[n]不是nil而a[N+1]是nil”成立的值N(N >= 1,由1开始),即使有的更高的索引不是nil值。例如,
-- 这不是序列,因为a[3]是nil而a[4]不是 a = { 1, 2, nil, 4 } -- 会输出2或4。 -- 即使这个表没有被修改,这个值也有可能改变。 mw.log( #a )
Lua的操作符优先级,从高到低为:
在同一级中,二元运算符会从左到右运算,例如a / b / c
相当于(a / b) / c
。幂运算和级联会从右往左,例如a ^ b ^ c
相当于a ^ (b ^ c)
>
Lua的函数调用与其他的语言很类似:函数名称后面跟着被括号括起来的参数列表。
func( 表达式列表 )
和往常一样在Lua表达的列表,列表中的最后一个表达式可以提供多个参数值。
如果传递给函数的参数比函数定义中的参数少,则额外的参数将被赋值nil。如果表达式列表的值比参数多,多余的值会被舍弃。可以让函数接受可变个数的参数,参见函数声明的细节。
Lua允许直接调用由函数返回的值,例如func()()
。如果需要比变量访问更复杂的表达式来确定要调用的函数,则可以使用括号表达式来代替变量访问。
Lua的语法有两个常见的语法糖例子。第一个是当一个表被当做对象使用,并且这个对象有一个函数被调用,那么语法
table:name( 表达式列表 )
完全等同于
table.name( 表, 表达式列表 )
第二种常见的情况就是Lua通过含有名称至值的映射的表作为函数唯一参数实施命名的参数的工具(直截了当说,就是将一个由花括号分割的表作为唯一参数)。这种情况下,包围着参数的括号可以省去。如果将一个(由引号或中括号分割的)字符串作为调用函数时的唯一参数,那么包围着这个参数的括号也可以省去。比如调用
func{ arg1 = exp, arg2 = exp } func"string"
等同于
func( { arg1 = exp, arg2 = exp } ) func( "string" )
它们也可以被组合使用。以下使用是等价的:
table:name{ arg1 = exp, arg2 = exp } table.name( table, { arg1 = exp, arg2 = exp } )
方法的定义语法如下:
function name <sub>optional</sub> ( var-list<sub>optional</sub> ) 语句块 end
var-list中的所有变量对函数都是局部的,这些变量被函数调用的表达式列表赋值。在这个语句块中,多余的局部变量会被忽略。
var-list是可选的,但这不意味着函数不能拥有可用变量。
这隐性地声明了命名为arg
的局部变量,并初始化为标准(且可修改)的Lua表,包含所有参数值,其中在函数调用中提供并计算的每个参数值的整数位置是用来索引存储在局部arg
表的那个值的键(nill值也会作为参数传递但不存在表中,整数位置进展到下一个位置,所以表不一定是序列)。
声明一个var-list也会同时声明局部变量,并初始化为从arg[1]
、arg[2]
等得到的值(顺序与var-list中指定的变量名称顺序相同)。
函数被调用时,block中的语句会在由var-list创建与变量表对应的局部变量和指定值之后执行。如果执行到返回语句,语句块就会退出,函数调用表达式的值就会是返回语句给予的值。如果执行到代码段末尾,还没有返回语句,则函数调用返回的结果是0个值。
Lua函数是词法闭包。一个常见的习惯用法是在函数声明的作用域内声明“私有静态(private static)”变量作为局部变量。比如,
-- 这会返回将它的参数增加一个数字的函数 function makeAdder( n ) return function( x ) -- 外面的这个n在这里是可以加到x中的 return x + n end end local add5 = makeAdder( 5 ) mw.log( add5( 6 ) ) -- 输出11
函数可以声明接受可变数量的(即任何数量个)参数,通过将...
作为变量列表的最后一项:
function name<sub>optional</sub> ( var-list, ... ) 语句块 end -- or function name<sub>optional</sub> ( ... ) 语句块 end
在这个语句块内,可以使用变量表达式...
,结果会是函数调用中的所有额外的值。比如,
local join = function ( separator, ... ) -- 把额外的变量收集到一个新表中 local args = { ... } -- 获得当前额外变量的准确个数 local n = select( '#', ... ) return table.concat( args, separator, 1, n ) end join( ', ', 'foo', 'bar', 'baz' ) -- 返回字符串"foo, bar, baz"
如果...
是在var-list中给予的唯一项,你不需要在新的表中获得变量;你可以直接引用明确声明了的arg
以及作为索引所有参数值的表初始化的局部变量。
select()函数就是用来作用于这些参数表达式的;特别地,如要获取参数表达式的值的数量,应当使用select( '#', ... )
而非#{ ... }
来数参数表达式有多少个,因为{ ... }
不一定是序列。
Lua为将函数声明和赋值提供到变量中提供语法糖;参见函数声明语句的细节。
注意这个不会起效:
local factorial = function ( n ) if n <= 2 then return n else return n * factorial( n - 1 ) end end
因为这个函数声明是在局部变量赋值声明完成之前就处理好的,函数主体中的“factorial”会指向函数外(通常是未定义的)变量。这个问题可以通过先声明一个局部变量然后再将它分配到后来的声明中,或者使用函数声明语句语法。
语句是执行的基本单元:一个赋值、控制结构、函数调用、变量声明,等等。
代码块(chunk)是语句(statements)的序列,可以由分号分开。一个代码块基本上被考虑为匿名函数的主体,所以它可以声明局部变量,接受参数,并返回值。
语句块(block)也是语句序列,就像一个代码块(chunk)。语句块可以被分隔以创建单个语句(statement):do 语句块 end
。这些通常用来限制局部变量的作用范围,或者在另一个块的中间加入return
或break
。
变量列表 = 表达式列表
var-list是由逗号分隔的变量;表达式列表是由逗号分隔的一组一个或多个表达式。所有的表达式都会在赋值之前被求值,所以a, b = b, a
会交换a与b的值。
local 变量列表
local 变量列表 = 表达式列表
局部变量可以在一个语句块或代码块内任意地方声明。第一种形式,不需要表达式列表,声明变量但不赋值,所以这些变量都会将nil作为值二中形式,为局部变量赋值,参见上面的赋值。
注意:局部变量显式声明于local关键字后面,形式为local 变量名。比如语句 local x = x
声明一个名为“x”的局部变量,并将全局变量“x”的值赋予这个变量。局部变量只在其声明的语句块结尾前的地方生效。
while 表达式 do 语句块 end
只要表达式还是(视为)true时,就会反复执行while语句。
repeat 语句块 until 表达式
反复执行语句块,直到表达式(视为)是true。语句块内声明的局部变量可以用于表达式中。
for 名称 = 表达式1, 表达式2, 表达式3 do 语句块 end
for 名称 = 表达式1, 表达式2 do 语句块 end
for循环的第一种形式会声明一个局部变量,然后从exp1以exp3的步长到exp2重复语句块。注意exp3可以省略,相当于1,但是非数字值比如nil
和false
是错误的。循环开始前,所有的表达式都会先被计算。
这种形式的for循环大致相当于
do local var, limit, step = tonumber( exp1 ), tonumber( exp2 ), tonumber( exp3 ) if not ( var and limit and step ) then error() end while ( step > 0 and var <= limit ) or ( step <= 0 and var >= limit ) do local name = var block var = var + step end end
不过变量var、limit和step在其他地方都不可访问。注意变量“name”是对语句块是局部变量;如果要在循环以外用它的值,它必须被复制到在循环外面定义的变量。
第二种形式的for循环会与迭代函数一起作用。就像在第一种形式里,表达式列表会在开始循环之前就赋值了。
这种形式的for循环大致相当于
do local func, static, var = expression-list while true do local var-list = func( static, var ) var = var1 -- ''var1''是''var-list''中的第一个变量 if var == nil then break end block end end
除了变量func、static和var在其他地方不能被获得。注意var-list中的变量在语句块中相当于局部变量;如要在循环外使用它们,需要复制到在循环之外声明的变量。
通常expression-list是返回3个值的一个函数调用。如果迭代器函数可以被写入,那么只取决于传入的参数,这会更加有效。否则,在Lua中编程建议返回闭包比返回表更好,因为静止的变量在每次迭代更新其成员。
if 表达式1 then 语句块1 elseif 表达式2 then 语句块2 else 语句块3 end
当表达式1返回true时执行语句块1,否则,当表达式2返回true时执行语句块2,否则执行语句块3。else 语句块3
部分可以省去,elseif 表达式2 then 语句块2
部分可以重复,也可以省去。
return 表达式列表
返回语句用来返回从函数或者代码块(只是一个函数)。表达式列表是由逗号分隔开的零个或更多个表达式。
Lua实现尾调用(tail calls)。如果表达式列表包含一个函数调用,对那个函数的调用会重新使用当前的堆栈项(stack frame)。这可用于处理调用堆栈的函数,比如getfenv()
和debug.traceback()
。
返回语句必须是语句块的最后一个语句。如果某些原因语句块的中间需要返回,那么可能需要明显的语句块do return end
。
break
break语句用来中止一个while、repeat或for循环的执行,并跳到循环后面的语句。
break声明必须是语句块(block)的最后一个声明。如果某些原因语句块的中间需要中断,那么可能需要明显的语句块do return end
。
函数可以作为语句被调用,此时函数只会起到任何的“副作用(side effects)”(例如mw.log()向日志输出信息),返回的值会被忽略。
Lua提供了语法糖来使得函数的定义更加自然。以下几种定义相互等价。
-- 基本声明 function func( var-list ) [[#block|语句块]] end func = function ( var-list ) [[#block|语句块]] end
-- 局部函数 local function func( var-list ) [[#block|语句块]] end local func; func = function ( var-list ) [[#block|语句块]] end
-- 作为表中的域的函数 function table.func( var-list ) [[#block|语句块]] end table.func = function ( var-list ) [[#block|语句块]] end
-- 作为表的方法的函数 function table:func( var-list ) [[#block|语句块]] end table.func = function ( self, var-list ) [[#block|语句块]] end
注意,这里的冒号符号与函数调用的冒号符号相类似,在参数列表的开头添加了一个隐式参数,名为self
。
错误可以通过error()和assert()“抛出”,使用pcall() 或者xpcall()可以“捕获”错误。注意,某些Scribunto的内部错误是不能被Lua层面的代码捕获处理。
Lua能自动管理内存。这意味着你不需要关心新建对象时内存空间的申请,或者对象不需使用时内存空间的释放。Lua的内存管理会自动执行“垃圾回收”,将不会再被访问的死对象或者被弱引用保持的对象的内存空间收回。几乎所有Lua类型元素都能被回收,包括表、方法、字符串等。
垃圾回收是自动运行的,不能被Scribunto配置。
Lua标准库为Lua提供基本的性能和关键功能。本文档只给出Lua标准库中在Scribunto启用的一部分内容。
这个变量持有对当前全局变量表的引用;全局变量foo
也会被关联到_G.foo
。注意,然而,对_G本身并没有什么特别的;它可能被以同样的方式作为任何其他变量:
foo = 1 mw.log( foo ) -- 输出1 _G.foo = 2 mw.log( foo ) -- 输出2 _G = {} -- _G不再指向全局变量表 _G.foo = 3 mw.log( foo ) -- 还是输出2
全局变量表可以当作普通的表来使用。例如,
-- 调用一个名称存储在变量中的函数 _G[var]() -- 输出所有局部变量的名称和转化为字符串后的值 for k, v in pairs( _G ) do mw.log( k, v ) end -- 输出新的局部变量的创建 setmetatable( _G, { __newindex = function ( t, k, v ) mw.log( "Creation of new global variable '" .. k .. "'" ) rawset( t, k, v ) end } )
包含正在运行的Lua语言版本的字符串,例如“Lua 5.1”。
assert( v, message, ... )
如果v
是nil或false,抛出错误,message
就会用作错误的文本:如果错误文本为nil(或者未指定),则文本是"assertion failed!"(“断言失败!”);如果是字符串或者数字,文字就是那个值;否则assert本身就会抛出错误。
如果v
是任何其他的值,assert就会返回包括v
和message
在内的全部变量。
在Lua的一个比较常见的惯用用法是,一个函数在正常操作时返回true值,并在失败时返回nil或false作为为第一个值、错误信息作为第二值。容易的错误检查可以通过调用函数assert
来实现:
-- 这个不会检查错误 local result1, result2, etc = func( ... ) -- 这个作用相同,但是会查错 local result1, result2, etc = assert( func( ... ) )
error( message, level )
用文本message
来发出一个错误。
error
一般会提供出错的位置的信息。如果level
是1或者省略,那么信息就是调用error
本身的位置,2使用被调用错误的函数调用的位置,等等。0会省略位置信息。
getfenv( f )
注意,这个函数可能会无效,取决于配置中的allowEnvFuncs
。
返回运行环境(全局变量表),就像f
指定的:
getfenv
函数的环境。通常这与_G相同。通过所有的基本函数和Scribunto基本库函数使用的环境都被保护。尝试访问这些环境中使用getfenv
将返回nil。
getmetatable( table )
如果元表拥有__metatable
域,这个值就会直接返回,而不是返回事实上的元表。
ipairs( t )
返回3个值:迭代函数、表t
和0。它是供for
的迭代形式使用的:
for i, v in ipairs( t ) do -- process each index-value pair end
它会迭代数对(1, t[1])、(2,t[2])等,直到t[i]是nil时。
如果__ipairs
元方法存在,那么标准行为会被覆盖,调用会返回与__ipairs( t )
的返回值一致的值。
next( table, key )
允许遍历表中的键。如果key
是nil或者未指定,返回表中的第一个键和值,否则,返回下一个键和值。如果没有更多的键可以用,返回nil。可以通过使用next( t ) == nil
来检查表是否是空的。
注意键被返回的顺序是没有指定的,即使表有数字的索引(indexes)。如要以数字顺序遍历表,使用数字的for或ipairs。
如果遍历时使用next,任何不存在的键被赋给一个值,则行为未定义。给一个存在的域赋一个新的值(包括nil)是可以的。
pairs( t )
返回三个值:迭代器函数(next或者类似的)、表t
和nil。这是用于for
的迭代器形式。
for k, v in pairs( t ) do -- 处理每个键值对 end
这会遍历t
中的键值对,就像next做的那样。参考next的文档以了解遍历期间修改表的限制。
如果__pairs元方法存在,那么标准行为会被覆盖,调用会返回与__pairs( t )
的返回值一致的值。
pcall( f, ... )
用指定的参数在“保护模式”下调用函数f
。这意味着如果在调用f
时出错,pcall会返回false与错误消息。如果没有错误发生,pcall会返回true与调用返回的所有值。
用伪代码表示,pcall
的定义类似如下:
function pcall( f, ... ) try return true, f( ... ) catch ( message ) return false, message end end
rawequal( a, b )
与a == b
相同,只是忽略了所有__eq元方法。
rawget( table, k )
与table[k]
相同,只是忽略了所有__index元方法。
rawset( table, k, v )
与table[k] = v
相同,只是忽略了所有__newindex元方法。
select( index, ... )
如果index
是数字,返回index之后的...
中对应位置的数。如果index
是字符串"#",返回...
中参数的个数。
也就是说,select
有点像以下代码,只是即使当...
包含nil值时也可以正常工作(参考#和unpack以了解关于nil的问题)。
--[=[select()函数事实上内置的实现比这个更加高效,且知道参数列表的实际闲置,或许有50这么小,所以可以枚举并检测从1到50的整个序列的键。 ]=] function select( index, ... ) local t = { ... } if index == '#' then --return #t -- 不起作用。 local n = 0 for k in pairs(t) do --assert( type( k ) == 'number', "参数键可能是数字" ) if k > n then --assert( k == math.floor( k ), "参数键可以是整数" ) --assert( k <= 50, "参数数量应当低于Lua的实现限制" ) n = k end end return n else return unpack( t, index ) end end
setmetatable( table, metatable )
设置表的元表,metatable
可能是nil,但是必须是清楚地提供的。
如果当前的元表有一个__metatable域,setmetatable
会报错。
tonumber( value, base )
尝试将value
转化为数字。如果已经是数字或者可以转化为数字的字符串,tonumber
就会返回这个数字,否则会返回nil。
base
是可选的,默认为10,指定解析数字的进位基数。这个基数可以是2到36之间的任何整数。对于大于10,字母A(大小写均可)代表10,B代表11,以此类推,Z代表35。
十进制下,值可以有小数部分,或者以科学计数法表示,而且甚至可以以“0x”开头以表示16进制。其他情况,只会接受不带符号的整数。
tostring( value )
将value
转化为字符串。参考上方的数据类型以了解各种类型被转换时的细节。
对于表,标准的转换行为可以被__tostring元方法覆盖。如果这个元方法存在,那么调用tostring会返回由__tostring( value )
返回的单个值。
type( value )
以字符串形式返回value
的类型"nil"
、"number"
、"string"
、"boolean"
、"table"
或"function"
。
unpack( table, i, j )
从给定的表返回值,像table[i], table[i+1], ···, table[j]
这样的如果被写出会直接返回。i
和j
如果没有给出或者是nil,取其默认值1和#table
。
注意如果table
不是一个序列且j
是nil或未指定,则结果是不确定的,参考长度操作符以了解详细。
xpcall( f, errhandler )
这个很像pcall
,只是错误消息在返回之前传递到函数errhandler
中。
用伪代码表示,xpcall
的定义类似如下:
function xpcall( f, errhandler ) try return true, f() catch ( message ) message = errhandler( message ) return false, message end end
debug.traceback( message, level )
以字符串的形式返回调用栈。可选的message参数会被连接到调用栈信息的前面。可选的level参数表示返回多少层调用栈。
math.abs( x )
返回x
的绝对值。
math.acos( x )
返回x
的反余弦值(以弧度表示)。
math.asin( x )
返回x
的反正弦值(以弧度表示)。
math.atan( x )
返回x
的反正切值(以弧度表示)。
math.atan2( y, x )
使用两个参数的符号(signs)以找到结果的象限,返回y/x
的反正切值(弧度制)。
math.ceil( x )
返回不小于x
的最小整数。
math.cos( x )
返回x
(以弧度表示)的余弦值。
math.cosh( x )
返回x
的双曲余弦值。
math.deg( x )
将弧度角x
转化为角度。
math.exp( x )
返回<math>e^x</math>。
math.floor( x )
返回小于或等于x
的最大整数。
math.fmod( x, y )
返回x
除以y
的余数,并将商舍入到零。比如,math.fmod( 10, 3 )
产生1
。
math.frexp( x )
返回像这样的两个值m
和e
:
x
是无穷大且非零,那么<math>x = m \times 2^e</math>、e
是整数,m
的绝对值在<math>[0.5, 1)</math>区间内x
是零,那么m
和e
都是0x
是NaN(非数字)或无穷大,那么m
是x
而e
不指定代表正无穷大的值;比任何其他数值都要大或与之相等。
math.ldexp( m, e )
返回<math>m \times 2^e</math>(e
是整数)。
math.log( x )
返回x
的自然对数。
math.log10( x )
返回x
的以10为底的对数。
math.max( x, ... )
返回其参数的最大值。
对于NaN的行为未指定。当前,如果x
是NaN,那么会返回NaN,但是其他的NaN就会被忽略。
math.min( x, ... )
返回其参数的最小值。
对于NaN的行为未指定。当前,如果x
是NaN,那么会返回NaN,但是其他的NaN就会被忽略。
math.modf( x )
返回两个数字,x
的整数部分和x
的小数部分。比如,math.modf( 1.25 )
产生1, 0.25
。
<math>\pi</math>的值。
math.pow( x, y )
与x^y
相同。
math.rad( x )
将角度x
转化为弧度角。
math.random( m, n )
返回伪随机数。
参数m
、n
可省略,但是如果指定了,则必须能够转化为整数。
Note that there is a bug in Lua 5.1, which is what Scribunto uses, where this function internally uses signed int instead of unsigned int. math.random(0, 2^32-1)
and math.random(0, 2^31-1)
are incorrect because of this, for example.
math.randomseed( x )
以x
作为伪随机数生成器的种子。
注意使用同一个种子会导致math.random
输出相同的数列。
math.sin( x )
返回 x
(以弧度表示)的正弦值。
math.sinh( x )
返回x
的双曲正弦值。
math.sqrt( x )
返回x
的平方根。与x^0.5
相同。
math.tan( x )
返回x
(以弧度表示)的正切值。
math.tanh( x )
返回x
的双曲正切值。
os.clock()
返回程序大约使用的CPU时间,以秒为单位。
os.date( format, time )
返回包含日期和时间的字符串或表,以format
为格式。如果格式被省略或者是nil,则使用“%c”。
如果给定了time
,则就是被格式化的时间(参考os.time()
。否则使用当前的时间。
如果format
以!开头,则日期按照UTC格式而不是服务器的本地时间。在这个可选字符之后,如果格式是字符串"*t",那么日期返回带有以下域的表。
如果格式不是"*t",那么日期以字符串形式返回日期,按照和C函数strftime相同的规则格式化。
os.difftime( t2, t1 )
返回从t1
到t2
两个时间的秒数。
os.time( table )
返回代表当前时间的数字。
调用且没有变量时,返回当前时间。若传入了表,则表中编码的时间就会被解析。表必须有years、month、days这几个域,并且可能也包括hour(默认为12)、min(默认为0)、sec(默认为0)和isdst。
require( modulename )
加载指定的模块。
首先会检查package.loaded[模块名]
以检查模块是否已被加载,如果是,返回package.loaded[模块名]
。
否则,返回package.loaders
序列中的每一个加载器以尝试寻找模块的加载器。若找到加载器,则调用这个加载器。加载器返回的值存储在package.loaded[modulename]
中并将其返回。
参见package.loaders
以了解可用的加载器的信息。
例如,如果你有一个模块“模块:Giving”其中有如下代码:
local p = {} p.someDataValue = '您好!' return p
你可以用以下代码在其它模块载入此模块:
local giving = require( "Module:Giving" ) local value = giving.someDataValue -- 值现在等于 '您好!'
这个表存储已加载的模块。键为模块名称,值为模块被加载时返回的值。
表存储了在加载模块时要用的搜索器函数(searcher function)的序列。每一个搜索器函数会被带有单个参数调用:要加载的模块名称。如果找到模块,搜索器必须返回会事实上加载这个模块的函数,并返回要被require返回的值。否则,返回nil。
Scribunto提供了两种搜索器:
package.preoload[modulename]
中寻找加载器函数注意没有包括标准的Lua加载器。
这个表存储加载器函数,被Scribunto在package.loaders中包括的第一个搜索器。
package.seeall( table )
在所有字符串函数中,第一个字符是第1位,而不是像C、PHP、JavaScript中的那样第0位。索引(indexes)可以是负的,表示从字符串最末开始倒数,比如-1表示最后一个字符,-2表示倒数第二个,等等。
警告:字符串库假定单字节字符串编码。不能处理Unicode字符。要对Unicode字符进行操作,使用Scribunto Ustring库中对应的方法。
string.byte( s, i, j )
如果字符串被考虑为字节的数组,返回s[i]
、s[i+1]
、···、s[j]
的字节值。i
的默认值为1;j
的默认值为i
。等价于mw.ustring.byte()。
string.char( ... )
接受零个或更多个整数。返回和长度与参数个数相同的字符串,每个字符的字节值等于其对应的参数。
local value = string.char( 0x48, 0x65, 0x6c, 0x6c, 0x6f, 0x21 ) --值现在是'Hello!'
参看mw.ustring.char()以了解使用Unicode codepoint而非字节值的类似函数。
string.find( s, pattern, init, plain )
寻找字符串s
中pattern
的第一个匹配(match)。如果找到一个匹配,返回s
中起止点的序列,否则返回nil。如果匹配模式有捕获物(capture),则在成功的匹配中被捕获的值也会被返回在两个索引之后。
第三个参数init
是可选的,指定从哪里开始搜索,默认值是1,可以是负数。第四个参数plain
也是可选的,如果是true,则会关闭模式匹配机制,则函数做的只是简单地“找子串”操作,pattern
中的字符就不会被看作魔法字符。
注意给了plain
就必须给init
。
参考mw.ustring.find()以了解用于Ustring pattern的类似函数,而且init
是按照字符而非字节。
string.format( formatstring, ... )
返回变量数字的参数将第一个参数(必须是字符串)格式化后的版本。
格式字符串使用printf
格式指定器但有所限制。
转换指定器q类似于s,但是会以特定的专用于表述字符串的格式来形成字符串;字符串会被写在双引号中,所有的双引号、新行、嵌入的零、反斜杠都会被转义。
数字和字符串之间的转换会像数据类型中说的那严格:其他类型不会自动转化为字符串。包含NUL字符的字符串(字节值0)不能被正常处理。
string.gmatch( s, pattern )
返回一个迭代器函数,每次被调用,都会从字符串s
中的pattern
返回下一个捕获。如果pattern
不会指定捕获,则整个匹配都会在每次调用时产生。
对于这个函数,开始的^
不是魔法字符,因为这个会避免迭代。它被看做是普通字符。
参看mw.ustring.gmath()以了解其类似函数,其匹配模式是被扩展的,参考Ustring匹配模式。
string.gsub( s, pattern, repl, n )
将字符串s
的所有(或者前n
个,如果给定了)出现的pattern
替换为由repl
指定的替换物(replacement),这个替换物可以是字符串、表或者函数。gsub
也会作为第二个值返回发生了的匹配的总次数。
如果repl
是一个字符串,则其值直接用于替换。字符%
用作转义符(escape character):repl
中的任何%d
形式的序列,d是1到9之间,代表第d个被捕获的子串。序列%0
代表整个匹配(match),序列%%
代表单个%
。
如果repl
是表,则每次匹配查询这个表,其键(key)为第一个捕获物(capture);如果匹配模式(pattern)不指定捕获,则整个匹配(match)用作键。
如果repl
是函数,则每次匹配发生时调用这个函数,所有被捕获的子串都会依次被传入作为参数。如果匹配模式不指定捕获,则整个匹配会作为单个参数传入函数。
如果表格查询或者函数调用返回的值是字符串或者数字,则用作替换字符串,否则,如果是false或nil,则不会进行替换,也就是说原始匹配仍保留在字符串中。
参看mw.ustring.gsub()以了解其类似函数,其匹配模式是被扩展的,参考Ustring匹配模式。
string.len( s )
返回字符串的字节长度。不会被ASCII NUL字符混淆。等同于#s。
参看mw.ustring.len()以了解使用Unicode codepoint而非字节值的类似函数。
string.lower( s )
将字符串的所有ASCII大写字符转为小写后返回。所有其他字符不改变。
参考mw.ustring.lower()以了解类似的函数,该函数可以将Unicode定义的所有的大写字母转化为小写字母。
string.match( s, pattern, init )
寻找字符串中pattern
的第一个匹配,如果找到一个,则match
返回从样式匹配中的捕获,否则返回nil。如果pattern
不指定捕获,则返回整个字符串。
第三个参数init
是可选的,用来表示从哪里开始搜索,其默认值为1,可以是负数。
参看mw.ustring.math()以了解其类似函数,其匹配模式是被扩展的,参考Ustring匹配模式。
string.rep( s, n )
返回字符串s
重复n
次并连接后的字符串。等价于mw.ustring.rep()。
string.reverse( s )
返回字符串s
被逆转后的字符串(按字节逆转)。
string.sub( s, i, j )
返回s
的从i
开始持续到j
的子串(substring);i
和j
可以是负的。如果j
是nil或未指定,则会一直到字符串末尾。
注意字符串是从索引1开始的。使用这个函数时,两边的所有索引都是包括的(inclusive)。
特别地,调用string.sub(s,1,j)
会返回字符串s
的长度j
的前缀,而string.sub(s, -i)
会返回字符串s
的长度为i
的后缀。
参看mw.ustring.sub()以了解使用字符而非字节值的类似函数。
string.upper( s )
将字符串的所有ASCII小写字符转为大写后返回。所有其他字符不改变。
参考mw.ustring.upper()以了解类似的函数,该函数可以将Unicode定义的所有的小写字母转化为大写字母。
注意Lua的匹配模式类似于正则表达式(regular expression),但是并不一样。特别地,注意正则表达式和PCRE之间的以下区别:
%
)而非反斜杠(\
)。.
)总是匹配所有字符,包括新行。|
操作符)。*
、+
、?
和-
)只能用于单独的字符或者字符类,不能捕获组。-
,相当于PCRE的*?
量词。{"n","m"}
。^
、$
和%f[set]
frontier样式,像PCRE的\b
和(?=…)
不可用。注意匹配模式不能包含嵌入的零字节(ASCII NUL,"\0"
)。应该使用%z
。
参考Ustring匹配模式以了解使用Unicode字符的类似的样式匹配机制。
字符类是一组字符的集合。以下集合可以用于定义字符类。
Template:Var
|
(Template:Var 不是魔法字符^$()%.[]*+-? 之一)代表字符Template:Var 自身。
|
---|---|
.
|
(一个点)代表所有字符。 |
%a
|
代表所有ASCII字母。 |
%c
|
代表所有ASCII控制字符。 |
%d
|
代表所有数字。 |
%l
|
代表所有ASCII小写字母。 |
%p
|
代表所有标点字符。 |
%s
|
代表所有ASCII空白字符。 |
%u
|
代表所有ASCII大写字母。 |
%w
|
代表所有ASCII字母数字字符。 |
%x
|
代表所有十六进制数字。 |
%z
|
代表所有ASCII NUL,即零字节。 |
%A
|
所有不在%a 中的字符。
|
%C
|
所有不在%c 中的字符。
|
%D
|
所有不在%d 中的字符、
|
%L
|
所有不在%l 中的字符。
|
%P
|
所有不在%p 中的字符。
|
%S
|
所有不在%s 中的字符。
|
%U
|
所有不在%u 中的字符。
|
%W
|
所有不在%w 中的字符。
|
%X
|
所有不在%x 中的字符。
|
%Z
|
所有不在%z 中的字符。
|
%Template:Var
|
(Template:Var 不是字母数字字符)代表字符Template:Var 。这是转义魔法字符的标准方式。任何标点字符(甚至是非魔法字符)都可以跟'% '用以代表样式匹配中的自身。
|
[[[:Template:Var]]]
|
代表集合Template:Var中所有字符的组合。一系列字符可以通过用' 范围和类之间的交互是没被定义的,因此像 |
[^Template:Var]
|
代表Template:Var的补集。 |
一个模式条目可以是
*
'前的单个字符类,匹配这个类中重复0次或者更多次的字符。这个重复项总是匹配可能的最长序列。+
'前的单个字符类,匹配这个类中重复一次或者更多次的字符。这个重复项总是匹配可能的最长序列。-
'前的单个字符类,匹配这个类中重复0次或者更多次的字符。不像*
,这个重复项总是匹配可能的最短序列。?
'前的单个字符类,匹配这个类中0次或1次出现的字符。%n
,n可以是1到9之间,匹配相当于第n个被捕获的子字符串(见下)。%bxy
,x和y是两个不同的字符,匹配从x开始、以y结尾的字符,且x和y的数目是平衡的。也就是说,如果从左到右读,读到x时加一,读到y时减一,那么结束的y则是第一个计数到达0时的y。例如,%b()
是一个平衡的表达。%f[set]
,一个frontier pattern,这样的项匹配任何位置的空字符串,而下一个字符属于集合set,而前一个字符不属于set。集合set在前面已经有描述。子项目的开始和结束时按照字符'\0'处理的。'\0'模式(pattern)是模式条目(pattern item)的序列。
模式开头的^
会从字符串的开始处匹配,而模式末尾的$
会匹配字符串的最末尾。其他地方的^
和$
都代表自身,无特殊含义。
模式可以包括用小括号括起来的子模式(sub-patterns),描述了“捕获”。匹配成功时,字符串的匹配捕获的子字符串会被存储(被“捕获”)以备使用。捕获是根据左边的括号被标号的,并通过以%
为前缀的方式引用:%1
、%2
(在PCRE中:$1
)。比如,在模式(a*(.)%w(%s*))
中,匹配a*(.)%w(%s*)
的字符串部分被存储在第一个捕获(所以是第一项),匹配.
的字符被捕获,记为第2项,匹配%s*
的则是第3项。
捕获参考可以出现在字符串自身,而返回参考早前被捕获的文本。比如,([a-z])%1
会匹配任何一对相同的小写字母,而([a-z])([a-z])([a-z])[a-z]%3%2%1
会匹配任何7个字母的回文。
特殊情况,空的捕获()
会捕获当前的字符串位置(一个数字)。比如我们对字符串"flaaap"
执行模式"()aa()"
,那么会有两个捕获:3和5。
这个库的大多数函数假设作为参数的表是序列。
函数table.foreach()
、table.foreachi()
和table.getn()
或许可用但是不推荐。应该使用pairs()的for循环、ipairs()的for循环和长度操作符。
table.concat( table, sep, i, j )
给一个所有元素都是字符串或数字的数组,返回table[i] .. sep .. table[i+1] ··· sep .. table[j]
。
sep
的默认值为空字符串,i
的默认值为1,j
的默认值为表的长度。如果i
大于j
,返回空字符串。
table.insert( table, value )
table.insert( table, pos, value )
在表table
的位置pos
处插入元素value
,会将其他元素的位置增加1以给这个元素提供插入空间。pos
的默认值为表的长度加1,所以调用table.insert(t, x)
会在表t
的末尾插入x
。
大于#table
的元素都会被提高,参考长度操作符以了解当表不是序列时的注意事项。
table.maxn( table )
返回给定的表的最大正数索引,或者表没有正数索引时返回零。
会遍历整个表,大致相当于
function table.maxn( table ) local maxn, k = 0, nil repeat k = next( table, k ) if type( k ) == 'number' and k > maxn then maxn = k end until not k return maxn end
table.remove( table, pos )
从表格table
中移走位于pos
处的元素,将后面的元素前移。pos
的默认值为表的长度,所以调用table.remove( t )
会移除表t
的最后一个元素。
大于#table
的元素都会被移动,参考长度操作符以了解当表不是序列时的注意事项。
table.sort( table, comp )
从table[1]
到table[#table]
,按照给定的次序给表的元素排序。如果给了comp
,则它必须是接收两个表元素的函数,并且当第一个小于第二个时返回true(所以not comp(a[i+1],a[i])
会在排序后为true)。如果没有给定comp
,则使用标准的Lua操作符%lt;
。
排序算法并不稳定;也就是说,当两个元素按照给定的顺序被看作相等时,它们在排序后的相对位置可能会改变。
所有Scribunto库位于表mw
中。
mw.addWarning( text )
在预览编辑时加一个警告信息。text
解析为维基文本。
mw.allToString( ... )
对所有的参数调用tostring(),然后用制表符作为分隔符连接起来。
mw.clone( value )
深拷贝一个值。所有的表和它们的元表被重构,但是新表和旧表共用函数。
mw.getCurrentFrame()
返回目前的框架对象,通常是最近的#invoke
中的框架对象。
mw.incrementExpensiveFunctionCount()
使得“高开销解析器函数”计数器加一,并在其超过限制时抛出异常(参见$wgExpensiveParserFunctionLimit|$wgExpensiveParserFunctionLimit
)。
mw.isSubsting()
如果当前的#invoke
被替换引用时返回true,否则false。参见上方讨论的返回文本。
mw.loadData( module )
有时一个模块需要大量表格的数据,例如,用于转换计量单位的通用模块可能需要一张大表的已识别的单位及其转换系数。而且有时这些模块会在一个页面中使用多次。每次{{#invoke:}}
都解析大表格的数据会用大量时间。mw.loadData()
正是为了避免这个问题。
mw.loadData
类似于require()
,但是有以下区别:
{{#invoke:}}
就解析一次。package.loaded
中。从加载的模块返回的值必须是表。其他数据类型不支持。
mw.loadData()
返回的表会元方法,可以提供只读获取由模块返回的表。因为不能直接包含数据,pairs()
和ipairs()
会起作用,但是其他方法如#值
、next()
和表库的函数不会起作用。上述假定的单位转换模块可能将其代码存储在“Module:Convert”然后将其数据存储在“Module:Convert/data”,且“Module:Convert”会使用local data = mw.loadData( 'Module:Convert/data' )
来有效地加载数据。
mw.dumpObject( object )
将object
序列化为人类可读的字符串并返回。
mw.log( ... )
将参数传递到mw.allToString(),然后将结果字符串加载控制台后。
在调试控制台,print()
等价于这个函数。
mw.logObject( object )
mw.logObject( object, prefix )
调用mw.dumpObject()然后将结果加到控制台输出的后面。如果给了prefix
,则会被加到控制台输出并紧随一个等于号在序列化字符串之前,比如输出的字符串可以是"prefix = object-string"。
框架(frame对象)是接口。通过框架来访问传递至{{#invoke:}}
和解析器函数的参数。
注意没有框架库,也没有叫做frame
的全局变量。框架对象通常为被{{#invoke:}}
调用的函数的参数,当然也可以从mw.getCurrentFrame()
获得。
用来访问传递到frame的参数的表。例如,一个模块从如下的维基文本调用
{{#invoke:module|function|arg1|arg2|name=arg3}}
那么frame.args[1]
会返回"arg1"
,frame.args[2]
会返回"arg2"
,frame.args['name']
或frame.args.name
会返回"arg3"
。在参数列表迭代可以使用pairs( frame.args )
或ipairs( frame.args )
。
然而基于Lua对迭代器的实现,迭代的顺序不确定,参数出现在维基文本中的顺序也无从得知。
注意这个表的值总是为字符串,tonumber()
可以用于在需要时转化为数字。但是,键是数字,即使在调用时清楚提供:{{#invoke:module|function|1|2=2}}
给予被数字键1
和2
索引的字符串值"1"
和"2"
。
因为在MediaWiki模板调用中,具名参数会在传递到Lua时移除名称和值的多余空格,而隐式参数不会移除空格。
考虑到性能,frame.args
使用元表,而非直接包含参数。参数值会从MediaWiki被要求得到。这意味着大多数其他表格方法不会正常工作,包括#frame.args
、next( frame.args )
和表格库中的函数。
如果像模板调用和三层括号变量这样的预处理器(preprocessor)语法在#invoke的参数中被使用,那么这些不会被展开,而在传递到Lua之后,知道值被Lua获取。如果特定的特殊标签写成了XML标记形式,比如<pre>
、<nowiki>
、<gallery>
和<ref>
,被包括在需要调用的参数中,这些标签会被转化为strip marker——一种特殊字符串,由删除符(ASCII 127)开始,在从#invoke返回后转化为HTML。
frame:callParserFunction( name, args )
frame:callParserFunction( name, ... )
frame:callParserFunction{ name = string, args = table }
调用解析器函数,返回适当的字符串。这相比于frame:preprocess
更优,但如果有可能,最好优先使用原生的Lua函数或Scribunto库函数。
以下调用与以下维基文本基本相同:
-- {{ns:0}} frame:callParserFunction{ name = 'ns', args = 0 } -- {{#tag:nowiki|some text}} frame:callParserFunction{ name = '#tag', args = { 'nowiki', 'some text' } } frame:callParserFunction( '#tag', { 'nowiki', 'some text' } ) frame:callParserFunction( '#tag', 'nowiki', 'some text' ) frame:callParserFunction( '#tag:nowiki', 'some text' ) -- {{#tag:ref|some text|name=foo|group=bar}} frame:callParserFunction{ name = '#tag:ref', args = { 'some text', name = 'foo', group = 'bar' } }
注意,函数名称和参数不会在传递到解析器函数之前被预处理(preprocess),frame:expandTemplate()也是如此。
frame:expandTemplate{ title = title, args = table }
这是嵌入包含。函数调用
frame:expandTemplate{ title = 'template', args = { 'arg1', 'arg2', name = 'arg3' } }
在Lua脚本中的行为大致和{{template|arg1|arg2|name=arg3}}
在维基文本中的行为一样。如果页面名没有名字空间前缀,那么函数会认为页面在模板名字空间内。
注意标题与参数在传递到模版之前并未预处理:
-- 这与维基文本{{template|{{!}}}}基本相同 frame:expandTemplate{ title = 'template', args = { '|' } } -- 这与维基文本{{template|{{((}}!{{))}}}}基本相同 frame:expandTemplate{ title = 'template', args = { '{{!}}' } }
frame:extensionTag( name, content, args )
frame:extensionTag{ name = string, content = string, args = table_or_string }
这大致相当于调用frame:callParserFunction(),其函数名称为'#tag:' .. name
而content
加到参数args
中。
-- 这些都相同 frame:extensionTag{ name = 'ref', content = 'some text', args = { name = 'foo', group = 'bar' } } frame:extensionTag( 'ref', 'some text', { name = 'foo', group = 'bar' } ) frame:callParserFunction{ name = '#tag:ref', args = { 'some text', name = 'foo', group = 'bar' } } -- 这些都相同 frame:extensionTag{ name = 'ref', content = 'some text', args = 'some other text' } frame:callParserFunction{ name = '#tag:ref', args = { 'some text', 'some other text' } }
frame:getParent()
被由{{#invoke:}}
创建的框架调用,返回调用了{{#invoke:}}
的页面的框架。如果在那个框架调用,会返回nil。
比如,如果模板{{Example}}
包含代码{{#invoke:ModuleName}}
,而另一页嵌入包含(transclude)那个页面并给{{Example|arg1|arg2}}
提供参数,则在“Module:ModuleName”调用mw.getCurrentFrame():getParent().args[1], mw.getCurrentFrame():getParent().args[2]
会返回"arg1", "arg2"
。
frame:getTitle()
以字符串形式返回与框架关联的标题。对于由{{#invoke:}}
创建的框架,返回被调用的模块的标题。
frame:newChild{ title = title, args = table }
创建新的框架对象,该对象是当前框架对象的子对象,可以有可选的参数和标题。
这个主要用于测试函数要被{{#invoke:}}
调用时的调试。任何一次创建的框架的数量是受限制的。
frame:preprocess( string )
frame:preprocess{ text = string }
会在当前框架环境下展开维基文本,比如,模板、解析器函数以及像code>{{{1}}}这样的参数都会展开。某些特殊的写成XML格式的标记,比如<pre>
、<nowiki>
、<gallery>
和<ref>
都会被替换为“strip marker”——一类特殊的字符串,由删除符(ASCII 127)开头,在从#invoke
返回后被替换成HTML。
如果你使用单个模板,使用frame:expandTemplate
而非尝试建造维基文本以使用这个方法。尽管这样更慢一点(根据实验),但这样更不容易出错,尤其是参数包含管道符或其他维基标记时。
同理,展开单个解析器函数时应使用frame:callParserFunction
。
frame:getArgument( arg )
frame:getArgument{ name = arg }
获得特定参数的对象,或者没有提供参数时返回nil。
返回的对象有一个方法,object:expand()
,可以返回对应参数的展开后的维基文本。
frame:newParserValue( text )
frame:newParserValue{ text = text }
返回有一个方法object:expand()
的对象,该方法可以返回frame:preprocess( text )
的结果。
frame:newTemplateParserValue{ title = title, args = table }
返回有一个方法object:expand()
的对象,该方法可以返回使用给定的参数调用frame:expandTemplate
的结果。
frame:argumentPairs()
等同于pairs( frame.args )
。考虑到向后兼容。
mw.hash.hashValue( algo, value )
按照指定的算法算出字符串的哈希值。可以通过mw.hash.listAlgorithms()获得有效的算法。
mw.hash.listAlgorithms()
返回支持的哈希算法的列表,以用于mw.hash.hashValue()。
mw.html
是用于在Lua中构建复杂HTML树的友好接口。使用mw.html.create
方法来创建mw.html对象。
被记为mw.html.name
在全局mw.html
表是可用的,被记为mw.html:name
和html:name
是一个HTML对象的方法(参见mw.html.create
)。
一个基础的例子如下所示:
local div = mw.html.create( 'div' ) div :attr( 'id', 'testdiv' ) :css( 'width', '100%' ) :wikitext( 'Some text' ) :tag( 'hr' ) return tostring( div ) -- Output: <div id="testdiv" style="width:100%;">Some text<hr /></div>
mw.html.create( tagName, args )
创建一个新的mw.html对象,其包含一个标签名称为tagName
的HTML元素。你也可以传递一个空的字符串或nil作为tagName
,以创建一个新的空的mw.html对象。
args
可以是有以下键的表:
args.selfClosing
:强制当前标签自我闭合,即使mw.html不认为其为自我闭合的args.parent
:当前mw.html实例的上级对象(用于内部使用)html:node( builder )
向当前的mw.html实例附加mw.html(builder
)子节点。如果传递nil,那么函数不做任何事。(builder
)节点是要创建的HTML元素的种类的字符串代表。
html:wikitext( ... )
给mw.html对象加上不定数量的维基文本字符串。
注意遇到第一个nil项就会停。
html:newline()
给mw.html对象加新行。
html:tag( tagName, args )
给mw.html对象添加一个新的节点,其标签名称为tagName
,返回代表这个新的节点的mw.html实例。args
参数和mw.html.create
的参数是一样的。
html:attr( name, value )
html:attr( table )
将节点的HTML属性的name
属性的值设为value
。也可以选择使用表,其键值对即为属性名称-值对。第一种形式中,如果值为nil,会导致这个给定名称的已被设置属性设为未被设置。
html:getAttr( name )
获得已经通过html:attr()
设置的属性name
的值。
html:addClass( class )
给节点的类(class)属性添加一个类名称(class name)。如果参数为nil,则无效。
html:css( name, value )
html:css( table )
使用给定的name
和value
给节点设置CSS属性。也可以选择使用表,其键值对即为CSS名称-值对。第一种形式中,如果值为nil,会导致这个给定名称的已被设置的CSS设为未被设置。
html:cssText( css )
给节点的属性添加一些纯css
文本。如果参数为nil,则无效。
html:done()
返回当前节点被创建时所在的上级节点。类似于jQuery.end,这是个方便地函数可以允许创建多个子节点,而由一个语句串在一起。
html:allDone()
类似于html:done()
,但是会遍历直到树节点的根部再返回。
语言代码在语言代码中由描述。很多MediaWiki的语言代码类似于IETF语言标签,但不是所有MediaWiki语言代码都是有效的IETF标签,反之亦然。
被记为mw.language.name
在全局mw.language
表是可用的,被记为mw.language:name
和lang:name
是一个语言对象的方法(参见mw.language.new
或mw.language.getContentLanguage
)。
mw.language.fetchLanguageName( code, inLanguage )
给定的语言代码的完整语言名称:默认为本地名称,如有inLanguage
的值,则是被翻译为目标语言的语言名称。
mw.language.fetchLanguageNames()
mw.language.fetchLanguageNames( inLanguage )
mw.language.fetchLanguageNames( inLanguage, include )
获取MediaWiki已知的语言列表,返回将语言代码映射到语言名称的表。
默认返回的名称是语言自称;传递inLanguage
值会返回那个语言下的所有名称。
默认只会返回MediaWiki已知的语言名称,给include
传递'all'
会返回所有可用的语言(例如,从Template:Ll中),传递'mwfile'
会仅包括拥有在MediaWiki核心或启用的扩展包括的自定义消息的语言。如要清楚地选择默认,返回'mw'
。
mw.language.getContentLanguage()
mw.getContentLanguage()
返回wiki当前的默认语言的语言对象。
mw.language.getFallbacksFor( code )
返回MediaWiki针对指定语言代码的备选语言代码列表。
mw.language.isKnownLanguageTag( code )
若语言代码为MediaWiki已知的语言,返回true。
语言代码“已知”意味着是个“有效的内置代码”(例如,对于mw.language.isValidBuiltInCode
返回true),对于mw.language.fetchLanguageName
返回一个非空字符串。
mw.language.isSupportedLanguage( code )
检查MediaWiki的语言代码内是否有任何本地化可用。
语言“受支持”意味着是个“有效的”代码(对于mw.language.isValidCode
返回true),不包含任何大写字母,并在MediaWiki的当前运行版本中有个消息文件。
一个语言代码可能既“受支持”又“未知”(例如,对mw.language.isKnownLanguageTag
返回true)。还要注意,尽管mw.language.isValidBuiltInCode
返回false,特定的代码仍是“受支持”的。
mw.language.isValidBuiltInCode( code )
如果语言代码是用于MediaWiki内部自定义的有效形式,返回true。
这个代码可能不对应任何已知语言。
语言代码是“有效的内置代码”意味着这是个“有效”代码(比如,对于mw.language.isValidCode
返回true),只包括ASCII字母、数字和连字符,并至少两个字符长度。
注意有些代码“受支持”(即mw.language.isSupportedLanguage
会返回true),即使这个函数返回false。
mw.language.isValidCode( code )
若语言代码字符串是有效形式的,返回true,无论其是否存在。这包括了所有单独用于通过MediaWiki名字空间自定义使用的语言代码。
这个代码可能不对应任何已知语言。
一个语言代码有效意味着不包含任何不安全字符(逗号、单双引号、斜杠、反斜杠、尖括号、连字号或ASCII NUL)且允许出现在页面标题中。
mw.language.new( code )
mw.getLanguage( code )
创建新的语言对象。语言对象没有任何可公开获取的属性,不过可以含有几个方法,下面列出。
不同语言代码在页面中的使用有次数限制。超过限制会报错。
lang:getCode()
返回这个语言对象的语言代码。
lang:getFallbackLanguages()
返回MediaWiki针对此语言对象的备选语言代码列表。等同mw.language.getFallbacksFor( lang:getCode() )
。
lang:isRTL()
若语言是从右至左写的,返回true,否则返回false。
lang:lc( s )
将字符串转化为小写,但遵从给定的语言的任何特殊规则。
当加载了ustring库,mw.ustring.lower()函数就会通过调用mw.language.getContentLanguage():lc( s )
来实现。
lang:lcfirst( s )
将字符串的第一个字符转化为小写,就像lang:lc()那样。
lang:uc( s )
将字符串转化为大写,但遵从给定的语言的任何特殊规则。
当加载了ustring库,mw.ustring.upper()函数就会通过调用mw.language.getContentLanguage():lc( s )
来实现。
lang:ucfirst( s )
将字符串的第一个字符转化为大写,就像lang:lc()那样。
lang:caseFold( s )
将字符串转换为不区分大小写的比较表示形式。注意,显示其结果可能无任何意义。
lang:formatNum( n )
lang:formatNum( n, options )
格式化数字,使用给定语言的合适的分组符合小数点。给予123456.78,可能会产生123,456.78、123.456,78或甚至١٢٣٬٤٥٦٫٧٨,取决于语言和wiki配置。
options
是包含选项设置的表,可以是:
noCommafy
:若为true,则忽略分组符并使用点(.
)作为小数点。 数字转化仍会发生,可能包括转化数字分隔符。lang:formatDate( format, timestamp, local )
根据给定的格式字符串格式化一个日期。如果省略了timestamp
,默认为当前时间。local
的值必须是boolean或nil,如果是true,时间会格式化为wiki的当地时间而非UTC。
timestamp
的格式字符串和支持的值与Template:Ll的#time解析器函数完全相同。
注意虽然反斜杠可能需要在Lua字符串字面量中写两次,由于Lua也使用反斜杠转义,而维基文本不需要:
-- 这个字符串字面量包含新行,不是两个字符"\n",所以不等同于{{#time:\n}}。 lang:formatDate( '\n' ) -- 等同于{{#time:\n}},不是{{#time:\\n}}。 lang:formatDate( '\\n' ) -- 等同于{{#time:\\n}},不是{{#time:\\\\n}}。 lang:formatDate( '\\\\n' )
lang:formatDuration( seconds )
lang:formatDuration( seconds, chosenIntervals )
将秒数的时间间隔转化为更加已读的单位,例如12345转化为3 hours, 25 minutes and 45 seconds(3时25分45秒),作为字符串返回结果。
chosenIntervals
,如提供,是一个指定了要在响应中使用的间隔单位名称的表(table)。包括'millennia', 'centuries', 'decades', 'years', 'weeks', 'days', 'hours', 'minutes'和'seconds'。
lang:parseFormattedNumber( s )
这需要一个以lang:formatNum()格式化的数字,并返回实际数字。换句话说,这基本上是tonumber()
根据语言转换的版本。
lang:convertPlural( n, ... )
lang:convertPlural( n, forms )
lang:plural( n, ... )
lang:plural( n, forms )
从forms
(必须是序列表)或...
基于数字n
选择合适的语法形式。例如,在英语你必须使用n .. ' ' .. lang:plural( n, 'sock', 'socks' )
或n .. ' ' .. lang:plural( n, { 'sock', 'socks' } )
来生成语法正确的文本:只有1 sock或200 socks。
序列的必填值取决于语言,详见魔术字的本地化和translatewiki针对PLURAL的常见问题。
lang:convertGrammar( word, case )
lang:grammar( case, word )
convertGrammar
匹配MediaWiki的Language对象的相同名称的方法的顺序,而grammar
匹配相同名称的解析器函数的顺序,可参考帮助:魔术字#本地化。This chooses the appropriate inflected form of word
for the given inflection code case
.
The possible values for word
and case
are language-dependent, see Special:MyLanguage/Help:Magic words#Localisation and translatewiki:Grammar for some details.
lang:gender( what, masculine, feminine, neutral )
lang:gender( what, { masculine, feminine, neutral } )
选择对应what
的性别的字符串,可以是male、female或注册的用户名。
lang:getArrow( direction )
返回对应方向direction
的Unicode箭头字符:
lang:getDir()
根据语言的书写方向,返回"ltr"(从左至右)或"rtl"(从右至左)。
lang:getDirMark( opposite )
返回包含U+200E(从左至右标记)或U+20F(从右至左标记)的字符串,取决于语言的书写方向以及opposite
的值。
lang:getDirMarkEntity( opposite )
返回“‎”或“‏”,取决于语言的书写方向和opposite
的值。
lang:getDurationIntervals( seconds )
lang:getDurationIntervals( seconds, allowedIntervals )
将秒数的时间间隔转化为更加已读的单位,例如12345转化为3 hours, 25 minutes and 45 seconds(3时25分45秒),返回从单位名称映射到数字的表。
例如, { ['hours'] = 3, ['minutes'] = 25, ['seconds'] = 45 }
allowedIntervals
, if given, is a table with values naming the interval units to use in the response. These include 'millennia', 'centuries', 'decades', 'years', 'days', 'hours', 'minutes', and 'seconds'.
The unit names in allowedIntervals
may be specified in any order (currently in English only, indendantly of the language object used, and with their plural unabbreviated form only like in the returned table, where unit names are symbolic but still not translated and not grammatically changed according to their assigned value). If the input table contains only unsupported unit names, the returned table will be empty. If the input table is not specified, is nil, or is empty, a static table for any supported units (including 'seconds' for the shortest unit) will be used by default.
The specified duration in seconds is first rounded down to an integer number of the shortest desired unit. The number of members in the returned array is variable, and only unit names mapped to a non-zero value are kept in the returned table if the rounded number of seconds is strictly positive. Otherwise only the member for the shortest desired unit name ('seconds' by default) will be set to the rounded down duration.
这个库是对本地化消息和MediaWiki:名字空间的界面。
被记为mw.message.name
在全局mw.message
表是可用的,被记为mw.message:name
和msg:name
是一个消息对象的方法(参见mw.message.new
)。
mw.message.new( key, ... )
创建一个给定消息key
的新消息对象。
剩下的参数传递到新的对象的params()
的方法。
消息对象没有属性,但是有下面列出的几个方法。
mw.message.newFallbackSequence( ... )
创建给定的消息的新的消息对象(存在的第一个会被使用)。
消息对象没有属性,但有下面列出的几种方法。
mw.message.newRawMessage( msg, ... )
创建新的消息对象,使用给定的文本,而不是查找国际化的(internationalized)消息。剩下的参数会传递到新对象的params()
方法中。
消息对象没有属性,但是有下面列出的几个方法。
mw.message.rawParam( value )
包装(wrap)该值使之不会被msg:parse()
解析为维基文本。
mw.message.numParam( value )
包装(wrap)该值使之自动被格式化为lang:formatNum()
。注意这不依赖事实上有效的语言库。
mw.message.getDefaultLanguage()
返回默认语言的语言对象。
msg:params( ... )
msg:params( params )
给消息添加参数,参数可以一被传递为独立的参数或者作为一个序列表。参数必须是数字、字符串或由mw.message.numParam()或mw.message.rawParam()返回的特殊的值。如果使用序列表,参数必须是直接出现在表中,使用__index元方法的参考不起作用。
返回msg
对象,以允许链式调用。
msg:rawParams( ... )
msg:rawParams( params )
像:params(),但是会先通过mw.message.rawParam()传递所有的参数。
返回msg
对象,以允许链式调用。
msg:numParams( ... )
msg:numParams( params )
像:params(),但是会先通过mw.message.numParam()传递所有的参数。
返回msg
对象,以允许链式调用。
msg:inLanguage( lang )
指定一个语言,以在加工消息时使用。lang
可以是字符串,或者带有getCode()
元表的表(比如语言对象)。
默认的语言是由mw.message.getDefaultLanguage()
返回的。
返回msg
对象,以允许链式调用。
msg:useDatabase( bool )
指定是否在MediaWiki:名字空间查找消息(比如在数据库中查找),或者只是使用MediaWiki分配的默认消息。
默认为true。
返回msg
对象,以允许链式调用。
msg:plain()
替换参数按原样返回消息维基文本。模板调用和解析器函数都是完整的。
msg:exists()
返回表示消息键是否存在的布尔值。
msg:isBlank()
返回表示消息键是否有内容的布尔值。当消息键不存在或者消息是空字符串时返回true。
msg:isDisabled()
返回表示消息键是否被禁用的布尔值。如果消息键不存在,或者消息是空字符串,或者是字符串"-"则返回true。
包含当前MediaWiki版本信息的字符串值。
$wgScriptPath|$wgScriptPath
的值。
$wgServer|$wgServer
的值。
$wgSitename|$wgSitename
的值。
$wgStylePath|$wgStylePath
的值。
包含所有名字空间数据的表,由数字索引。
可用的数据为:
设置了元表以便于按照名称(本地化的或者规范的)查找名字空间。比如,mw.site.namespaces[4]
和mw.site.namespaces.Project
都会返回关于Project名字空间的信息。
只包含内容名字空间的表,按数字索引。参考mw.site.namespaces以了解详细内容。
只包含项目名字空间的表,按数字索引。参考mw.site.namespaces以了解详细内容。
只包含讨论名字空间的表,按数字索引。参考mw.site.namespaces以了解详细内容。
包含站点统计的表。可用的统计有:
mw.site.stats.pagesInCategory( category, which )
获得关于分类的统计数据。如果which
拥有指定值"*
",则结果为有如下内容的表:
如果which
是以上键(all、subcats、files、pages)中的一个,则结果为对应值的数字。
每次新的分类查询都会增大高开销函数次数。
mw.site.stats.pagesInNamespace( ns )
返回给定的名字空间(由数字指定)的页面数量。
mw.site.stats.usersInGroup( group )
返回给定的用户组的用户数量。
mw.site.interwikiMap( filter )
返回包含可用的跨wiki前缀的数据的表。如果filter
是字符串"local",则只会返回关于本地跨wiki前缀的数据。如果filter
是字符串"!local",则只会返回非本地跨wiki前缀的数据。如果没有指定filter,则所有的前缀的数据都会返回。这个"local"前缀是同一个项目的。比如在英文维基百科,其他语言的维基百科都会考虑为本地的(local),而维基词典不会。
这个函数返回的表的键是跨wiki前缀,值是带有以下属性的子表:
$wgExtraInterlanguageLinkPrefixes|$wgExtraInterlanguageLinkPrefixes
。文本库提供了一些常见的文本处理函数,这些函数来自字符串库和Ustring库,并且可用于UTF-8字符串。
mw.text.decode( s )
mw.text.decode( s, decodeNamedEntities )
将字符串中的HTML元素替换为对应的字符。
如果布尔值decodeNameEntities
被省略或者为false,则只有被命名的实体“<”“>”“&”“"”和“ ”会被认可。否则,认可的HTML5命名实体的列表会从PHP的get_html_translation_table
函数中加载。
mw.text.encode( s )
mw.text.encode( s, charset )
使用HTML实体替换字符串中的字符。字符“<”“>”“&”“"”和非换行空格会被适当的命名实体替换,所有其他的都会被替换为数字实体。
如果提供了charset
,则它应该是合适的字符串,且被Ustring模式的括号括住,比如[set]
中的“set”。默认的charset是'<>&"\' '
(末尾的空格为非换行空格,U+00A0)。
mw.text.jsonDecode( s )
mw.text.jsonDecode( s, flags )
解析JSON字符串。flags
是0或flagsmw.text.JSON_PRESERVE_KEYS
和mw.text.JSON_TRY_FIXING
的组合(使用+
)。
通常JSON的数组会被重组到Lua的有键的序列表,如果要避免这个,可以传入mw.text.JSON_PRESERVE_KEYS
。
如果要降低JSON的特定需求,比如数组或对象不应有结尾的逗号,可传入mw.text.JSON_TRY_FIXING
。不推荐这样做。
限制:
mw.text.JSON_PRESERVE_KEYS
。mw.text.jsonEncode( value )
mw.text.jsonEncode( value, flags )
编码JSON字符串。如果传入的值不能被JSON编码则会报错。flags
是0或flagsmw.text.JSON_PRESERVE_KEYS
和mw.text.JSON_PRETTY
的组合(使用+
)。
通常Lua的带有键的序列表会被编码称JSON的不带键的序列;如果flags
中设置了mw.text.JSON_PRESERVE_KEYS
,不带键的序列表会被编码为JSON数组。
限制:
[]
),而不是空的对象({}
)。__pairs
元方法。mw.text.JSON_PRESERVE_KEYS
。mw.text.killMarkers( s )
除去字符串中所有的strip marker。
mw.text.listToText( list )
mw.text.listToText( list, separator, conjunction )
使用自然语言组合一个列表,类似于table.concat()
,但是最后一项前面的分隔符不同。
默认的分隔符取自wiki内容语言的MediaWiki:comma-separator,默认的连词取自由MediaWiki:word-separator连接的MediaWiki:and。
比如,对消息使用默认值:
-- 返回空字符串 mw.text.listToText( {} ) -- 返回"1" mw.text.listToText( { 1 } ) -- 返回"1和2"(如果wiki的语言设置为“中文”,下同) mw.text.listToText( { 1, 2 } ) -- 返回"1、2、3、4和5" mw.text.listToText( { 1, 2, 3, 4, 5 } ) -- 返回"1; 2; 3; 4 or 5" mw.text.listToText( { 1, 2, 3, 4, 5 }, '; ', ' or ' )
mw.text.nowiki( s )
使用HTML实体替换字符串中的多种字符,以避免被解析为维基文本。包括:
mw.text.split( s, pattern, plain )
在匹配了Ustring模式的pattern
的地方分割字符串。如果指定了plain
且为true,则pattern
会被解释为纯字符串而不是Lua模式(就像mw.ustring.find()
的这个参数一样)。返回包含子字符串的表。
比如,mw.text.split( 'a b\tc\nd', '%s' )
会返回表{ 'a', 'b', 'c', 'd' }
。
如果pattern
匹配空字符串,s
会被分割成单个字符。
mw.text.gsplit( s, pattern, plain )
返回会迭代子字符串的迭代器函数,返回的相当于调用mw.text.split()
。
mw.text.tag( name, attrs, content )
mw.text.tag{ name = string, attrs = table, content = string|false }
生成name
的HTML样式的标签。
如果指定了attrs
,则必须是带有字符串键的表。字符串和数字值都会被使用为属性的值,布尔值的true会被输出为HTML5的无值参数,布尔值的false会跳过这个键,其他的都会错误。
如果没有给出content
(或者是nil),只会返回开始标签。如果content
是布尔值false,则会返回自我闭合标签。否则它必须是字符串或数字,这样内容就会被开始标签和结束标签包围。注意内容不会自动被编码为HTML,如有需要,使用mw.text.encode()。
对于返回扩展标签的属性,比如Template:Tag,应该使用frame:extensionTag()。
mw.text.trim( s )
mw.text.trim( s, charset )
从字符串的开始和结尾移除空白字符或其他字符。
如果提供了charset
,则它应该是合适的字符串,且被Ustring模式的括号括住,比如[set]
中的“set”。默认的charset是ASCII空白字符,"\t\r\n\f "
。
mw.text.truncate( text, length )
mw.text.truncate( text, length, ellipsis )
mw.text.truncate( text, length, ellipsis, adjustLength )
将文本text
裁剪到指定的长度,如果执行了裁剪,加入ellipsis
(省略号)。如果长度为正,则字符串末尾被裁剪,如果为负,则字符串的开头会被裁剪。如果给定了adjustLength
且为true,则包含省略号的字符串不会长于指定的长度。
ellipsis
的默认值取自wiki的内容语言的MediaWiki:ellipsis。
例如,使用默认的“...”省略号:
-- 返回"foobarbaz" mw.text.truncate( "foobarbaz", 9 ) -- 返回"fooba..." mw.text.truncate( "foobarbaz", 5 ) -- 返回"...arbaz" mw.text.truncate( "foobarbaz", -5 ) -- 返回"foo..." mw.text.truncate( "foobarbaz", 6, nil, true ) -- 返回"foobarbaz",因为比"foobarba..."更短 mw.text.truncate( "foobarbaz", 8 )
mw.text.unstripNoWiki( s )
将MediaWiki的<nowiki> strip marker替换为对应的文本。其他类型的strip marker不会改变。
mw.text.unstrip( s )
等同于mw.text.killMarkers( mw.text.unstripNoWiki( s ) )
。
这个不在显示特殊页面嵌入包含、<ref>后的HTML,就像Scribunto早期版本的那样。
mw.title.equals( a, b )
检测两个标题是否相等。注意比较时忽略碎片(fragments)。
mw.title.compare( a, b )
返回-1、0、1,表示标题a
是否小于、等于或大于标题b
。
这会按照作为字符串的跨wiki前缀(如果有)比较,然后按名字空间数字,然后按照作为字符串的未加前缀的标题文本比较。字符串比较使用Lua标准的<
操作符。
mw.title.getCurrentTitle()
返回当前页面的标题对象。
mw.title.new( text, namespace )
mw.title.new( id )
创建新的标题对象。 如果页面名称(参数text中)不可用,返回nil,但如果有效但不存在则仍然成功。
如果给了id
,则那个带有那个page_id的页面的对象会被创建。引用的标题会被认为链接到了当前页面。如果page_id不存在,返回nil。如果创建的标题对象不是对于已经加载的标题,则高开销函数数量会被增加。
然而,如果给了字符串text
,那么那个标题的对象就会被创建(即使那个页面不存在)。如果文本字符串不指定名字空间,则使用namespace
(可以在mw.site.namespaces
的任何键中找到)。如果文本不是有效的标题,则会返回nil。
mw.title.makeTitle( namespace, title, fragment, interwiki )
创建名字空间namespace
内标题title
的标题对象,可以有指定的fragment
和interwiki
前缀。namespace
可以是在mw.site.namespaces
中找到的任何键。如果结果的标题无效,返回nil。
注意,不像mw.title.new()
,这个方法总会应用指定的名字空间。比如,mw.title.makeTitle( 'Template', 'Module:Foo' )
会为页面Template:Module:Foo创建对象,而mw.title.new( 'Module:Foo', 'Template' )
会为页面Module:Foo创建对象。
标题对象有许多属性和方法。大多数属性是只读的。
注意以text
结尾的域返回作为字符串值的标题,而以title
结尾的域返回标题对象。
title.text
。title.text
。title.text
相同。mw.site.namespaces
中定义的任何键指定。mw.site.namespaces
中定义的任何键指定。mw.site.namespaces
中定义的任何键指定。mw.title.makeTitle( title.namespace, title.baseText )
。mw.title.makeTitle( title.namespace, title.rootText )
。mw.title.makeTitle( mw.site.namespaces[title.namespace].talk.id, title.text )
,如果该标题没有讨论页则为nil。mw.title.makeTitle( mw.site.namespaces[title.namespace].subject.id, title.text )
。mw.title.makeTitle( title.namespace, title.text .. '/' .. text )
.title.text
encoded as it would be in a URL.proto
may be specified to control the scheme of the resulting url: "http", "https", "relative" (the default), or "canonical".标题对象可以使用关系运算符比较。tostring( title )
会返回title.prefixedText
。
由于这可能难以置信,所以请注意获取标题对象的任何高开销的字段会记录一次对页面的“链入”(就像Special:链入页面中展示的那样)。使用标题对象的getContent()
方法或访问redirectTarget
字段会记录为“Template:Int”,访问标题对象的file
或fileExists
字段会记录为“Template:Int”。
代表File或Media名字空间下的页面的标题对象会拥有被file
调用的属性。这是高开销的。这是一个表,其结构如下:
fileExists
属性的存在是为了考虑向后兼容,可以看做该属性的别称。如果这是false,所有其他属性都会是nil。属性id、isRedirect、exists和contentModel需要从数据库获取标题数据。因此,第一次获取除了当前页面之外的任何页面的这些属性中的一个时,高开销函数数量会增加。之后获取那个页面的这些属性中的任何一个都不会再次增加高开销函数数量。
其他标记为高开销的属性总是会在第一次获取除当前页面之外的页面时增加高开销函数数量。
mw.uri.encode( s, enctype )
百分号编码字符串。默认类型,"QUERY"
,使用“+”编码空格以用于查询字符;"PATH"
将空格编码为%20,"WIKI"
将空格编码为“_”。
注意"WIKI"格式不是完全可以逆转的,因为空格和下划线都会编码为“_”。
mw.uri.decode( s, enctype )
百分号解码字符串。默认类型,"QUERY"
,将“+”解码为空格;"PATH"
不执行额外的解码,"WIKI"
将“_”解码为空格。
mw.uri.anchorEncode( s )
编码字符串以用于MediaWiki URI fragment。
mw.uri.buildQueryString( table )
将表编码为URI查询字符串。键必须是字符串,值可以是字符串、数字、序列表或布尔值false。
mw.uri.parseQueryString( s, i, j )
将查询字符串s
解码为表。字符串中没有值的键会拥有false值,重复多次的键会有序列表作为其值,其他的都会有字符串作为值。
可选的数字参数i
和j
可以用于指定要解析的s
的子串,而非整个字符串。i
是子串的第一个字符位置,默认为1。j
是子串的最后一个字符位置,默认为字符串长度。i
和j
都可以是负数,就像string.sub那样。
mw.uri.canonicalUrl( page, query )
mw.uri.fullUrl( page, query )
mw.uri.localUrl( page, query )
mw.uri.new( s )
利用传入的字符串或表构造一个新的URI对象。参见URI对象的描述以了解表可能的域。
mw.uri.validate( table )
验证传入的表(或URI对象)是否有效。返回布尔值,以表示表是否有效,以及如果无效,一个描述问题发生原因的字符串。
URI对象有以下域,其中的部分或全部可能是nil:
以下属性也是可用的:
tostring()
会产生URI字符串。
URI对象的方法为:
uri:parse( s )
将字符串解析为当前的URI对象。字符串中指定的任何域都会被当前的对象替换;未指定的域都会保留旧值。
uri:clone()
制作URI对象的拷贝。
uri:extend( parameters )
将参数表合并到对象的查询表。
ustring库相当于标准字符串库的重新实现,不过方法会操作于UTF-8编码的字符串的字符,而非字节。
大多数函数会在字符串不是有效的UTF-8时报错,但有例外。
匹配模式(pattern)允许的最大长度,以字节为单位。
字符串允许的最大长度,以字节为单位。
mw.ustring.byte( s, i, j )
返回单独的字节,等同于string.byte()。
mw.ustring.byteoffset( s, l, i )
返回字符在字符串内的字节偏移值。l
和i
的默认值都是1.i
可以是负数,即倒过来计数。
The character at l
== 1 is the first character starting at or after byte i
; the character at l
== 0 is the first character starting at or before byte i
. Note this may be the same character. Greater or lesser values of l
are calculated relative to these.
mw.ustring.char( ... )
非常像string.char(),但是整数为Unicode代码点而非字节值。
local value = mw.ustring.char( 0x41f, 0x440, 0x438, 0x432, 0x435, 0x442, 0x21 ) -- 值现在为“Привет!“
mw.ustring.codepoint( s, i, j )
很像string.byte(),但是返回的值是代码点,且偏移值为字符而非字节。
mw.ustring.find( s, pattern, init, plain )
非常像string.find(),但是匹配模式是扩展了的,在Ustring patterns中有描述,且init
是按照字符而非字节。
mw.ustring.format( format, ... )
等同于string.format()。字符串的宽度和精度是以字节表达,而非编号。
mw.ustring.gcodepoint( s, i, j )
返回用于在字符串内迭代代码点的三个值。i
默认为1,j
默认为-1。这是为了用于for
形式的迭代:
for codepoint in mw.ustring.gcodepoint( s ) do -- 语句块 end
mw.ustring.gmatch( s, pattern )
非常像string.gmatch(),但是匹配模式是扩展了的,在ustring匹配模式中有描述。
mw.ustring.gsub( s, pattern, repl, n )
非常像string.gsub(),但是匹配模式是扩展了的,在ustring匹配模式中有描述。
mw.ustring.isutf8( s )
若字符串是有效的UTF-8,返回true,否则返回false。
mw.ustring.len( s )
返回字符串的长度,或者不是有效的UTF-8时返回nil。
参见string.len()以了解使用字节长度而非代码点的类似函数。
mw.ustring.lower( s )
非常像string.lower(),但是所有在Unicode中定义了小写到大写转换的字符都会被转换。
mw.ustring.match( s, pattern, init )
非常像string.match(),但是匹配模式是扩展了的,在ustring匹配模式中有描述,且init
偏移是按照字符而非字节。
mw.ustring.rep( s, n )
等同于string.format()。
mw.ustring.sub( s, i, j )
非常像string.sub(),但是偏移值为字符而非字节。
mw.ustring.toNFC( s )
将字符串转化为正规形式C。如果字符串不是有效的UTF-8则返回nil。
mw.ustring.toNFD( s )
将字符串转化为正规形式D。如果字符串不是有效的UTF-8则返回nil。
mw.ustring.upper( s )
非常像string.upper(),但是所有在Unicode中定义了大写到小写转换的字符都会被转换。
ustring函数中的匹配模式使用和字符串库匹配模式相同的语法。主要区别是,字符串类会根据Unicode字符属性重新定义。
%a
:代表一般类别“控制”中的所有字符。%c
:代表一般类别“控制”中的所有字符。%d
:代表一般类别“数字、十进制数字”中的所有字符。%l
:代表一般类别“小写字母”中的所有字符。%p
:代表一般类别“标点”中的所有字符。%s
:代表一般类别“分隔符”以及制表符、换行、回车、垂直制表符和换页符中的所有字符。%u
:代表一般类别“大写字母”中的所有字符。%w
:代表一般类别“字母或十进制数字”中的所有字符。%x
:加上十六进制数字的全宽字符。就像在字符串库匹配模式中的那样,%A
, %C
, %D
, %L
, %P
, %S
, %U
Template:IntTemplate:Int%W
代表所有补集(不在给定的一般类别内的所有字符)。
在所有情况下,字符串解析为Unicode字符而非字节,所以像[0-9]
这样的范围、%b«»
这样的模式匹配和应用于多个字符的量词都可以正确起作用。空的捕获会捕获代码点而非字节。
这些库默认不包括,但是如有需要可通过require()
加载。
可以通过以下方式模拟加载Lua 5.2 bit32
库
bit32 = require( 'bit32' )
bit32库提供了无符号的32位整数的位运算。输入的整数会被截成整数(方法未指定)并用232模除,这样值就是在0到232-1之间的,返回的值也会是这个范围。
如果字节被编号(就像bit32.extract()中那样),那么0是最低位的字节(带有值20的),31是最高位的(带有值231的)。
bit32.band( ... )
返回参数的“按位与”运算:对于结果中的每一位,只有当所有参数中都设置了该位时,结果中才会有这一位。
如果没有给参数,则结果会设置所有位。
bit32.bnot( x )
返回x
的“取反”。
bit32.bor( ... )
返回参数的“按位或”运算:对于结果中的每一位,只要所有参数中有任何一个设置了该位,结果中就会有这一位。
如果没有给参数,则结果会清除所有位。
bit32.btest( ... )
等同于bit32.band( ... ) ~= 0
bit32.bxor( ... )
返回参数的“按位异或”运算:对于结果中的每一位,只有所有参数中设置了该位的参数个数为奇数,结果中才会有这一位。
如果没有给参数,则结果会清除所有位。
bit32.extract( n, field, width )
Extracts width
bits from n
, starting with bit field
. Accessing bits outside of the range 0 to 31 is an error.
如未指定,width
默认为1。
bit32.replace( n, v, field, width )
Replaces width
bits in n
, starting with bit field
, with the low width
bits from v
. Accessing bits outside of the range 0 to 31 is an error.
如未指定,width
默认为1。
bit32.lshift( n, disp )
Returns the number n
shifted disp
bits to the left. This is a logical shift: inserted bits are 0. This is generally equivalent to multiplying by 2disp
.
Note that a displacement over 31 will result in 0.
bit32.rshift( n, disp )
Returns the number n
shifted disp
bits to the right. This is a logical shift: inserted bits are 0. This is generally equivalent to dividing by 2disp
.
Note that a displacement over 31 will result in 0.
bit32.arshift( n, disp )
Returns the number n
shifted disp
bits to the right. This is an arithmetic shift: if disp
is positive, the inserted bits will be the same as bit 31 in the original number.
Note that a displacement over 31 will result in 0 or 4294967295.
bit32.lrotate( n, disp )
Returns the number n
rotated disp
bits to the left.
Note that rotations are equivalent modulo 32: a rotation of 32 is the same as a rotation of 0, 33 is the same as 1, and so on.
bit32.rrotate( n, disp )
Returns the number n
rotated disp
bits to the right.
Note that rotations are equivalent modulo 32: a rotation of 32 is the same as a rotation of 0, 33 is the same as 1, and so on.
本库包含在实现Scribunto库时的一些有用方法。可以通过以下方式加载:
libraryUtil = require( 'libraryUtil' )
libraryUtil.checkType( name, argIdx, arg, expectType, nilOk )
type( arg )
不符合预期类型expectType
时报错。此外,如果arg
是nil且nilOk
为true,则不会报错。
name
是调用函数的名称,argIdx
是参数列表中参数的位置。这些用于格式化错误消息。
libraryUtil.checkTypeMulti( name, argIdx, arg, expectTypes )
type( arg )
不符合预期类型数组expectTypes
中的任何字符串时报错。
用于可以有多个有效类型的参数。
libraryUtil.checkTypeForIndex( index, value, expectType )
type( value )
不符合预期类型expectType
时报错。
用于实现__newindex
元方法。
libraryUtil.checkTypeForNamedArg( name, argName, arg, expectType, nilOk )
type( arg )
不符合预期类型expectType
时报错。此外,如果arg
是nil且nilOk
为true,则不会报错。
This is intended to be used as an equivalent to libraryUtil.checkType()
in methods called using Lua's "named argument" syntax, func{ name = value }
.
libraryUtil.makeCheckSelfFunction( libraryName, varName, selfObj, selfObjDesc )
This is intended for use in implementing "methods" on object tables that are intended to be called with the obj:method()
syntax. It returns a function that should be called at the top of these methods with the self
argument and the method name, which will raise an error if that self
object is not selfObj
.
This function will generally be used in a library's constructor function, something like this:
function myLibrary.new() local obj = {} local checkSelf = libraryUtil.makeCheckSelfFunction( 'myLibrary', 'obj', obj, 'myLibrary object' ) function obj:method() checkSelf( self, 'method' ) end function obj:method2() checkSelf( self, 'method2' ) end return obj end
The luabit library modules "bit" and "hex" may be loaded using
bit = require( 'luabit.bit' ) hex = require( 'luabit.hex' )
Note that the bit32 library contains the same operations as "luabit.bit", and the operations in "luabit.hex" may be performed using string.format()
and tonumber()
.
The luabit module "noki" is not available, as it is entirely useless in Scribunto. The luabit module "utf8" is also not available, as it was considered redundant to the Ustring library.
The pure-Lua backend to the Ustring library may be loaded using
ustring = require( 'ustring' )
In all cases the Ustring library (mw.ustring
) should be used instead, as that replaces many of the slower and more memory-intensive operations with callbacks into PHP code.
一些MediaWiki扩展提供额外的Scribunto库。这些都位于表mw
中,通常是在表mw.text
中,然而,这些只有在安装了特定扩展时才存在(加上Scribunto扩展本身)。
Such extensions use Scribunto provided hooks:
Writing Scribunto libraries provides information on how such libraries can be developed to provide Lua interfaces for MediaWiki extensions.
The following libraries are planned, or are in Gerrit pending review.
Template:Ll provides access to localizable structured data. See Template:Ll. This is supported by Wikidata.
WikibaseLexeme provides access to Wikibase Lexeme entities. This is supported by Wikidata:Lexicographical data.
WikibaseMediaInfo provides access to Wikibase MediaInfo entities. See Template:Ll. This is supported by Structured Data on Commons. See Commons:Structured data/Lua.
BCmath provides arbitrary-precision arithmetic to Lua modules. See BCmath documentation via "LDoc" link at Extension:BCmath#Usage.
Semantic Scribunto provides native support for the Scribunto extension to Semantic MediaWiki extension.
JsonConfig provides access to localizable tabular and map data. See Extension:JsonConfig/Tabular. Tabular Data and GeoJSON Map Data is supported in Commons "Data:" namespace.
Cargo provides a means to query its data store from Lua. See Extension:Cargo/Other features#Lua support.
CategoryToolbox provides a means to check from Lua if a certain page belongs to a category. Is is experimental and not enabled on public WikiMedia wikis.
FlaggedRevs provides a means to access the stability settings of a page from Lua.
TitleBlacklist provides a means to test and obtain information about blacklisted page naming entries from Lua.
ParserFunctions provides a means to evaluate a parser function expressions from Lua.
ArticlePlaceholder provides a means to override default Wikibase renderings from Lua. See Extension:ArticlePlaceholder/Module:AboutTopic.
ExternalData provides a means to get structured data from Internet from Lua. See Extension:External Data#Scribunto/Lua.
WikiSEO provides a means to set SEO Data for the current page. See Extension:WikiSEO#Usage in lua modules.
以下函数被修改了:
以下包被几乎移除。只有列出来的函数可用。
以下函数和包不可用。
{{#invoke:}}
and passing such data structures as parameters to Scribunto library functions that are implemented as callbacks into PHP.Such data structures may be used freely within Lua, including as the return values of modules loaded with mw.loadData()
.
This information is useful to developers writing additional Scribunto libraries, whether for inclusion in Scribunto itself or for providing an interface for their own extensions.
A Scribunto library will generally consist of five parts:
Existing libraries serve as a good example.
The PHP portion of the library is a class that must extend Scribunto_LuaLibraryBase
. See the documentation for that class for implementation details. In the Scribunto extension, this file should be placed in engines/LuaCommon/NameLibrary.php
, and a mapping added to Scribunto_LuaEngine::$libraryClasses
. Other extensions should use the ScribuntoExternalLibraries hook. In either case, the key should match the Lua module name ("mw.name" for libraries in Scribunto, or "mw.ext.name" for extension libraries).
The Lua portion of the library sets up the table containing the functions that can be called from Lua modules. In the Scribunto extension, the file should be placed in engines/LuaCommon/lualib/mw.name.lua
. This file should generally include boilerplate something like this:
<syntaxhighlight lang=lua> local object = {} local php
function object.setupInterface( options )
-- Remove setup function object.setupInterface = nil
-- Copy the PHP callbacks to a local variable, and remove the global php = mw_interface mw_interface = nil
-- Do any other setup here
-- Install into the mw global mw = mw or {} mw.ext = mw.ext or {} mw.ext.NAME = object
-- Indicate that we're loaded package.loaded['mw.ext.NAME'] = object
end
return object
The module in engines/LuaCommon/lualib/libraryUtil.lua
(load this with local util = require 'libraryUtil'
) contains some functions that may be helpful.
Be sure to run the Scribunto test cases with your library loaded, even if your library doesn't itself provide any test cases. The standard test cases include tests for things like libraries adding unexpected global variables. Also, if the library is loaded with PHP, any upvalues that its Lua functions have will not be reset between #invoke's. Care must be taken to ensure that modules can't abuse this to transfer information between #invoke's.
The Scribunto extension includes a base class for test cases, Scribunto_LuaEngineTestBase
, which will run the tests against both the LuaSandbox and LuaStandalone engines.
The library's test case should extend this class, and should not override static function suite()
.
In the Scribunto extension, the test case should be in tests/engines/LuaCommon/NameLibraryTest.php
and added to the array in ScribuntoHooks::unitTestsList()
(in common/Hooks.php
); extensions should add the test case in their own Template:Ll
hook function, probably conditional on whether $wgAutoloadClasses['Scribunto_LuaEngineTestBase']
is set.
Most of the time, all that is needed to make the test case is this:
class ClassNameTest extends Scribunto_LuaEngineTestBase { protected static $moduleName = 'ClassNameTest'; function getTestModules() { return parent::getTestModules() + array( 'ClassNameTest' => __DIR__ . '/ClassNameTests.lua'; ); } }
This will load the file ClassNameTests.lua
as if it were the page "Module:ClassNameTests", expecting it to return an object with the following properties:
n
, the name of test n
, and a string that is the expected output for test n
.n
and returns one string.If getTestModules()
is declared as shown, "Module:TestFramework" is available which provides many useful helper methods. If this is used, ClassNameTests.lua
would look something like this:
local testframework = require 'Module:TestFramework'
return testframework.getTestProvider( {
-- Tests go here
} )
Each test is itself a table, with the following properties:
The type controls the format of expect
and how func
is called. Included types are:
expect
is a table of return values, or a string if the test should raise an error. func
is simply called.expect
is a table of tables of return values. func
is called as with an iterated for loop, and each iteration's return values are accumulated.tostring()
.There are (at least) two ways to run PHPUnit tests:
If your extension's test class names all contain a unique component (e.g. the extension's name), the --filter
option may be used to run only your extension's tests.
Either of these will work fine if Scribunto is loaded in LocalSettings.php. And it is easy for method #1 to work if Scribunto is not loaded, as the UnitTestsList hook can easily be written to avoid returning the Scribunto test when $wgAutoloadClasses['Scribunto_LuaEngineTestBase']
is not set.
But Jenkins uses method #2. For Jenkins to properly run the tests, you will need to add Scribunto as a dependency for your extension. See Template:Gerrit for an example of how this is done.
If for some reason you need the tests to be able to run using method #2 without Scribunto loaded, one workaround is to add this check to the top of your unit test file:
<syntaxhighlight lang="php">
if ( !isset( $GLOBALS['wgAutoloadClasses']['Scribunto_LuaEngineTestBase'] ) ) { return; }
Modules included in Scribunto should include documentation in the Scribunto libraries section above. Extension libraries should include documentation in a subpage of their own extension page, and link to that documentation from the Extension libraries subsection above.