Tcl 基础知识
Tcl/Tk 的起源
Tcl 是“工具控制语言(Tool Control Language)”的缩写。Tk 是 Tcl“图形工具箱”的扩展,它提供各种标准的 GUI 接口项,以利于迅速进行高级应用程序开发。
John K. Ousterhout(见图像)于 1988 年开始开发 Tcl/Tk(读作“tickle tee-kay”),然后是加州大学伯克利分校(UCB)的一名教授继续对它进行开发。Tcl 是以可扩展性、短的学习曲线和易于嵌入为特定目标而设计的。Tk 的开发始于 1989 年,第一个版本于 1991 年问世。Ousterhout 博士在他离开 UCB 之后继续开发 Tcl/Tk,然后由于工作需要,他继续为 Sun Microsystems 公司工作。
工具 文件
在 Linux 系统上研究 Tcl/Tk,需要有两个主要程序。它们是 tclsh 和 wish。正如可以从其名称所辨别的那样,所以前者是 Tcl 外壳,常用于为外壳脚本提供执行环境。Wish 类似于 tclsh,它是针对窗口化的 GUI 环境。
输入下列命令,检查这些文件是否存在:
~/tcltk$ which tclsh |
which 命令将返回指定可执行文件的路径。如果没有看到与这相似的结果,则需要转到 Scriptics Tcl/Tk 页面下载并构建您自己的副本。当然,如果系统上不存在这些程序,并不表示有任何问题。不象 Perl,通常不会将 Tcl/Tk 视为是 Linux 操作的基本要素。我所知道的每个发行版都和某一版本的 Tcl/Tk 一起交付,最常见的扩展作为 CD-ROM 或在线资源库的一部分。从这些资源,这些工具通常很容易安装。如果有困难,请与 GNU/Linux 软件的发行商联系。
Tcl 语言
Tcl tick 的构成
在下面的清单中,将会发现第一个很常见的示例程序,它是用 Tcl 实现的。这是一个完整的脚本:第一行命令调用 tclsh 环境,第二行命令执行实际工作。用您所选择的文本编辑器创建该脚本,输入 chmod +x hello.tcl
使之成为可执行文件,然后执行它以测试您这件“作品”。
~/tcltk$ cat hello.tcl |
Tcl 和 Tk 是解释型的、可扩展脚本语言。与 BSD 许可证十分相似,该许可证允许在任何情况下自由使用该软件,只要在所有副本中保留该版权并且在任何分发中一字不差地传递通告。这个许可证条款使 Tcl/Tk 成为自由软件。
Tcl/Tk 是一种解释型环境。可以通过添加预编译的 C 函数来扩展 Tcl 解释器,可从 Tcl 环境内部调用 Tcl 解释器。可以为特定目的或一般的以及广泛使用的而定制这些扩展。我们将在教程的后面看一些扩展并着重看一下第一个扩展 ― 非常流行的 Expect。
在接下来的几屏中,将回顾 Tcl 语言的一些主要特性,从元字符和全局变量到运算符、数学函数以及核心命令。毕竟,这些命令使 Tcl/Tk 成为有特色的,逐步发展的语言。请记住,在本教程中没有篇幅涉及每条命令。这里只突出一部分,以后您可以更进一步了解 Tcl/Tk。
回页首
Tcl 元字符
#!/usr/bin/tclsh |
元字符是在 Tcl/Tk 环境的上下文中有特殊含意的字符或字符对,它们包括分组语句、封装字符串、终止语句以及其它,如下表所示。左边列出的代码中演示了一些元字符。要注意的一个特殊特性是,当使用花括号(防止替代和扩展)代替双引号时,输出中的差异。
字符 | 用作 |
# | 注释 |
; 或newline | 语句分隔符 |
| 变量(区分大小写) |
| 数组变量 |
| 多维数组 |
| 带替换的引用 |
| 不带替换的引用 |
| 命令替换 |
| 反斜杠替代 |
| 行继续(在行尾) |
回页首
Tcl 全局变量和反斜杠替代
#!/usr/bin/tclsh |
当 Tcl/Tk 脚本开始运行时,存在几个全局变量(如果在当前环境中为非空,则是预先定义的)。这些变量允许如下对操作系统进行访问:argc 是对脚本自变量的计数,而不是对调用的名称进行计数。 argv 是自变量的列表(不是数组)。argv0 是调用的文件名(可以是符号链接)。env 是根据当前外壳的环境变量名建立下标的数组。errorCode 存储有关最近的 Tcl 错误信息,errorInfo 包含对这同一个错误事件的堆栈跟踪。该列表还有另外 12 个 tcl_xxx 变量,从 tcl_interactive
到 tcl_version
。可以在 Tcl/Tk in a Nutshell 中找到好的总结,(有关更多信息,请参阅本教程末尾的“参考资料”)。
在左边的样本代码中,使用了其中几个变量以及(又一次)使用了一些反斜杠引用的字符(\n 和 \a)。 \ char
允许替代非打印 ASCII 字符。这对于 UNIX 下的许多脚本语言和外壳环境都是常见的。如表中说明的那样,对于没有定义替代的反斜杠引用的字符只被简单地回送到输出。
\字符 | 替代 |
\a | 响铃 |
\b | 退格 |
\f | 换页 |
\n 或 \newline | 新行 |
\r | 回车 |
\t | 水平制表 |
\v | 垂直制表 |
\space ("\ ") | 空格 |
\ddd | 八进制值 |
\xddd... | 十六进制值 |
\c | 回显‘c’ |
\\ | 反斜杠 |
回页首
Tcl 运算符和数学函数
~/tcltk$ cat maths.tcl |
Tcl 支持一组标准的运算符和数学函数。这些运算符包括算术、位和逻辑运算符,可以通过 expr 命令使用常规的运算符优先次序规则进行求值。另外,考虑到 Tcl 的实质是面向字符串的脚本语言,所以对一些数学函数进行了合理的补充:
- 三角函数包括 cos(x)、acos(x)、cosh(x)、sin(x)、asin(x)、sinh(x)、tan(x)、atan(x)、atan2(y, x)、tanh(x) 和 hypot(x, y)。与这些函数相关的单位是弧度。
- Log 函数是 exp(x)、log(x) 和 log10(x)。
- 算术函数是 ceil(x)、floor(x)、fmod(x, y)、pow(x, y)、abs(x)、int(x)、double(x) 和 round(x)。
- rand() 和 srand(x) 是处理随机数的函数。
左边这个示例使用了其中一些运算符和函数来计算指定点到原点之间的距离,并返回给定半径的圆的周长和面积。另外,在这个示例中,使用列表下标(lindex)命令来访问 $argv 的个别元素。
回页首
Tcl 中的循环和分支
... |
Tcl 中的循环命令是 while、for 和 foreach。条件(转移)命令是if/then/else/elsif 和 switch。上述命令的限定语句是 break、continue、return和 error。最后,catch 命令提供了错误处理能力。
if/then/else/elsif 已在前面几屏中演示过。在正式语法中会用到 then,但通常会省略掉它。
在左边这个示例中,foreach 结构给 switch 命令提供命令行自变量。当处理自变量时(注意:不正确的输入会终止脚本,因为还没有实现处理错误的 catch),while 循环通过为每一行调用过程并同时对行计数器加 1 来处理输入。代码段结束时,返回处理的行数。
回页首
Tcl 字符串和模式匹配
~/tcltk$ tclsh |
字符串是 Tcl 中的基本数据类型。string 命令实际上是一组命令,这些命令都是属于 string 的。在使用中,正如在左边的示例中所看到,string 读取的方式非常象来自 OOP 编程特定对象方法的应用程序。
表示信息的 string 命令是 length 和 bytelength(可以有所不同,这取决于字符集)。返回布尔值(1 或 0)的比较是 compare、equal 和 match。这里的模式匹配是由“文件名替换”(简单类型的匹配通常与外壳操作相关)完成。还可以通过独特的 regex 和 regsub 命令来使用“高级正规表达式”。
在 Tcl 中执行 index、last、first、wordend 和 wordstart 命令可以实现下标功能。字符串修改是由 tolower、toupper、totitle、trim、trimleft、trimright、replace 和 map 来处理的。后者需要预先定义一个字符映射表。用 range 抽取子字符串,用 repeat 多次输出字符串。
可以使用 append 命令,将文本添加到现有变量中。通过使用与 C 语言的 printf 命令相同的样式和约定,format 命令可用来生成输出字符串。scan 对字符串进行解析并将值赋值给变量。最后,从 Tcl 8.0 开始,用 binary format 和 binary scan 命令添加了将二进制数据作为字符串处理的功能(因而能够处理空字符,而不会失败)。
回页首
Tcl 列表
~/tcltk$ tclsh |
列表在 Tcl 中有两个主要用途。我们已经在通过 foreach 命令(在 Tcl 中的循环和分支中找到)处理命令行自变量的环境中看到第一个用途。第二个用途是动态地构建 Tcl 命令的元素,可以在本教程后面看到使用 eval 命令来执行这种用途。
list 命令接受它的所有自变量并将它们返回在一个列表环境中。自变量可以是值或变量。在左边这个示例中,可以手工创建列表,或可将其它列表视作自变量来使用列表(从而保存第一个“Party”的两对方向)。或者,concat 命令用于将两个或多个列表合并到顶级项的单个实体,返回第二个更有趣的“Party”。
其它一些有用的列表命令及其语法是:
- llength $List ― 返回顶级项的计数结果。
- lindex $List n ― 返回已建立下标的项,从 0 开始计数。
- lrange $List i j ― 返回列表元素的范围。
- lappend $List item... ― 将项附加到列表。
- linsert $List n item... ― 在列表中的指定位置上插入一项或多项,向下移列表中的其它项。
其余列表命令还包括 lreplace、lsearch 和 lsort。split 命令将字符串作为输入并生成经过正确解析的列表,并且在指定的字符处断开字符串。join 执行相反操作,接受列表元素并将它们串在一起,用 joinstring 分隔它们。
回页首
Tcl 数组
~/tcltk$ tclsh |
理解 Tcl 数组的捷径是,将它们视作与 Perl 散列相同的东西。Tcl 数组不是用数字建立下标的线性数据结构,除非选择对数据强加那种解释。尽管带空格的字符串需要用引号括起或需要一个变量引用,但下标(或键)可以是任何字符串。
正如一般的变量一样,使用 set 命令初始化数组,如左边所示。圆括号内是给出的下标部分。请注意,圆括号不象花括号或双引号那样提供分组。一旦初始化为数组,就不能将变量作为单一变量来访问。如左边列表底部所示,数组元素也可以是列表。
回页首
更多 Tcl 数组
array 命令是一种多用途工具,很象 string。array exists 命令用于测试变量是否作为数组存在,array get 用于将数组转换成列表格式,array set 用于将列表转换为数组,array names 用于返回下标列表,array size 用于返回对下标进行计数的结果。搜索整个数组有它自己的一组四个命令:array startseach、array anymore、array nextelement 和 array donesearch。
虽然设计之初 Tcl 数组是一维的,但有一个模拟多维结构的好方法。因为下标是任意字符串,所以二维数组可以声明如下:
set i 1 ; set j 10 |
这些数组键实际上分别只是字符串“1,10”和“1,11”,但对访问数据来说,谁知道这之间的差异?
回页首
Tcl 过程
#!/usr/bin/tclsh |
proc 命令定义 Tcl 过程。一旦定义后,就可以象内置的 Tcl 命令那样调用或使用它。另外,可以用缺省值定义这些参数;例如,将左边的定义更改为读取 proc c_area { {rad 1} }
。这将调用没有参数的 c_area 过程,并返回单位圆的面积。
所使用的 rename 命令正如它的字面含意一样,为现有命令或过程提供新名称。使用 rename 有两个明显的原因。第一个原因是,通过重命名原有过程,然后用相同名称的过程替换它,来给现有命令添加功能。过程可以调用原过程,必要时可以添加一些需要的功能。使用 rename 的第二个原因是,映射一个不存在的命令,例如,象 rename exec {};
一样,可以防止用户执行外部命令。
回页首
变量作用域规则
作用域规则描述了过程和变量名以及值在程序的不同层次上的可见性。例如,在脚本的最外层定义的变量是全局变量。缺省情况下,全局变量是不可见的,在过程内部也不可用它们的值。这允许过程的编写者自由地定义变量名并赋值,而不必担心覆盖对于局部作用域上未知的重要变量。要使全局变量在过程内部变得可见,必须将它声明为在过程内,就象在上一屏的示例中,对 PI 使用 global 命令那样。
upvar 命令提供将局部变量与另一个作用域中变量的值相关联的设施。这允许根据名称将变量调用进过程,这对于当过程需要可以修改在另一个作用域的值而不仅仅使用它时,就显得非常方便。这个命令语法是 upvar level $VarName LocalVar ,其中 level 是到当前作用域之外的步骤数。“#0”表示全局作用域这一层。
回页首
Tcl 中的数据结构
#!/usr/bin/tclsh |
除简单的多维数组以外,通常建议用已专门用于过程接口的数组来实现 Tcl 数据结构。从结构的使用者角度来看,虽然这种设计隐藏了具体实现细节,但提供了执行重要的错误检查能力。
左边这个示例中,在将 uData 声明为全局变量后,代码执行检查,以查看帐户是否已经不存在。如果存在,则过程返回(非零)错误消息。这个返回可以用于切换到生成错误文本输出。对于本例,我们简单地提供三个连续输入,其中包括一次重复输入。这会产生如示例底部所示的输出,“1”表示由于一个重复的帐户名称而引起的一个错误返回,这是我们有意这样做的。
其它可能的数据结构包括数组列表、已链接或双重链接的数组或其中的各种排列。因为 Tcl 8.0 所具有的列表重实现提供了不变的访问次数,所以数组列表结构相当有效。
回页首
路径和文件
~/tcltk$ tclsh |
文件和路径操作是跨平台环境中具有挑战性的问题。对于主机 OS,Tcl 使用 UNIX 路径名(缺省情况下,用‘/’字符分隔)和本机路径名结构。即使当程序内的数据构造正确时,也很难确保用户输入与系统需求匹配。file join 命令用于将 UNIX 格式转换成本机路径名。其它路径字符串命令包括 file split、dirname、file extension、nativename、pathtype 和 tail。
在它扮演的“工具控制语言”角色中,Tcl 有许许多多种内部文件测试和操作功能。每条命令都以 file 开始,正如 file exists name 中一样。其它测试命令(它们都返回布尔值)包括 executable、isdirectory、isfile、owned、readable 和 writable。
文件信息和操作(再提醒您一次,所有都是以 file 开始)是通过 atime、attributes、copy、delete、lstat、mkdir、mtime、readlink、rename、rootname、size、stat 和 type 来完成。请注意,在 Windows 或 Mac 环境中运行一些文件信息命令时,可能会返回未定义的数据,因为例如在那些文件系统中没有表示索引节点和符号(和硬)链接数据。
使用 file ... 命令而不使用通过 exec 的本机命令的好处在于,前者会提供一个可移植接口。
整个文档只简单地着重于 Tcl 语言的这一部分。然而,在您“品尝”完左边这个 tclsh 示例中这些命令的味道并对此感到满足之后,然后请继续阅读本教程结尾部分列出的“参考资料”。
回页首
Tcl 进程和文件 I/O
~/tcltk$ tclsh |
exec 命令用于显式地执行外部命令。在 Linux 下,当 Tcl 处于交互方式时,可以直接运行大多数外部命令,如左边示例所示。用 exec 运行时,会将程序的 stdout 输出返回到 Tcl,而不是返回到屏幕,这允许将数据赋值给变量。当程序在后台启动时,立即返回的值是程序的 PID。exec 程序可以充分利用 UNIX 环境中的 I/O 重定向和管道。
其它进程命令有 exit(终止正在运行的 Tcl 脚本)和 pid(返回当前或指定进程的 PID),对于出于各种目的的情况,这非常便利。Tcl 不合并任何本机进程控制命令,但可以将 exec 命令与 PID 数据一起使用来实现许多任务。
文件操纵使用下列命令:open、close、gets、puts、read、tell、seek、eof 和 flush。如左边所示,在文件打开命令期间 catch 命令对错误检查是有用的。当在遇到新的一行字符之前需要打印程序输出时,如在用户数据提示符中,使用 flush 来写输出缓冲区。
另外一个功能(在受支持的环境中)是以打开文件的方式打开管道的能力。例如,用 set Channel [open "|sort foobar" r] 打开管道通道后,第一个 gets 的输出将是“Eight”(文件数据“One”到“Ten”的输出在 10 个单独的行上按字母顺序排列)。
回页首
将 eval 用于动态脚本
~/tcltk$ cat input01.txt |
在这个示例中,您可以感到 eval 命令的强大功能。在正常情况下,Tcl 解释器以一遍方式(one-pass)操作:它首先对输入的命令行(可能延伸在几个物理行上)进行解析,并执行任何替代。然后开始执行,除非找到不正常或残缺命令。eval 允许第二遍方式(second pass)(或许更精确地讲,是预通过(pre-pass))。因而,可以先动态构造 Tcl 命令,然后进行解析并执行它。
在左边的列表中,输入文件由三行组成,每行都显示了一种算术运算。调用 tclsh 后,文件以只读方式打开并与 $InFile
变量相关联。while
循环每次将一行读入到 $Op
中。然后,通过预先计划将 expr
映射到 $Op 变量来构造整个 Tcl 命令。然后,扩展,求值,从而分配结果。最后,在 stdout
上显示每步操作和结果。
虽然该样本演示了相对琐细的 eval 应用程序,但从概念上讲,可以根据已知语法的输入文件的输入,很容易地将它扩展为动态文件和/或目录处理,或扩展为对文件类型、许可权、访问时间或任何种类的可测试元素的基本操作。
转载自:http://www.ibm.com/developerworks/cn/education/linux/l-tcl/section3.html