标准模板库

标准模板库(英语:Standard Template Library缩写STL),是一个C++软件库,大量影响了C++标准程序库但并非是其的一部分。其中包含4个组件,分别为算法容器函数迭代器[1]

模板是C++程序设计语言中的一个重要特征,而标准模板库正是基于此特征。标准模板库使得C++编程语言在有了同Java一样强大的类库的同时,保有了更大的可扩展性

历史

标准模板库系由Alexander Stepanov俄语Степанов,_Александр_Александрович_(учёный)创造于1979年前后,这也正是比雅尼·斯特劳斯特鲁普创造C++的年代。

虽然David R. Musser英语David R. Musser于1971年开始即在计算机几何领域发展并倡导某些泛型程序设计观念,但早期并没有任何程式语言支援泛型程序设计。第一个支援泛型概念的语言是Ada。[来源请求] Alex和Musser曾于1987开发出一套相关的Ada library.

标准模板库设计人Stepanov早期从事教育工作,1970年代研究泛型程序设计,那时他与其同事一起在GE公司开发出一个新的程序语言——Tecton。

1983年,Stepanov先生转至纽约大学坦登工程学院担任助理教授,继续研究泛型程序设计,同时写了许多Scheme的程序,应用在graph与network的演算法上,1985年又转至GE公司专门教授高阶程序设计,并将graph与network的Scheme程式,改用Ada写,用了Ada以后,他发现到一个动态(dynamically)类型的程序(如Scheme)与强制(strongly)类型的程序(如Ada)有多么的不同。

在动态类型的程序中,所有类型都可以自由的转换成别的类型,而强制类型的程序却不能。但是,强制类型在出错时较容易发现程序错误。

1988年Stepanov先生转至HP公司执行开发泛型程序库的工作。此时,他已经认识C语言中指标(pointer)的威力,他表示一个程序员只要有些许硬件知识,就很容易接受C语言中指标的观念,同时也了解到C语言的所有数据结构均可以指标间接表示,这点是C与Ada、Scheme的最大不同。

Stepanov并认为,虽然C++中的继承功能可以表示泛型设计,但终究有个限制。虽然可以在基础类型(superclass)定义算法和接口,但不可能要求所有物件皆是继承这些,而且庞大的继承体系将减低虚拟(virtual)函数的执行效率,这便违反的前面所说的“效率”原则。

到了C++模板观念,Stepanov参加了许多有关的研讨会,与C++之父比雅尼讨论模板的设计细节。如,Stepanov认为C++的函数模板(function template)应该像Ada一样,在声明其函数原型后,应该显式的声明一个函数模板之实例(instance);比雅尼则不然,他认为可以透过C++的重载(overloading)功能来表达。

Stepanov想像中的函数模板:

   //in *.hpp
   template<class T>
   T square(T x) { return x*x; }
 
   //in *.cpp
   double square(double);
   cout << square(3.3);
   int square(int);
   cout << square(3);

比雅尼认为的函数模板:

   //in *.hpp
   template<class T>
   T square(T x) { return x*x; }
 
   //in *.cpp
   cout << square(3.3);
   cout << square(3);

几经争辩,Stepanov发现比雅尼是对的(参考侯俊杰《标准模板库讲座·第三章》)。事后Stepanov回想起来非常同意比雅尼的作法。

事实上,C++的模板,本身即是一套复杂的巨集语言(macro language),巨集语言最大的特色为:所有工作在编译时期就已完成。显式的声明函数模板之实例,与直接透过C++的多载功能隐式声明,结果一样,并无很大区别,只是前者加重程序员的负担,使得程式变得累赘。

1992年Meng Lee加入Alex的专案,成为另一位主要贡献者。

1992年,HP泛型程序库计画结束,小组解散,只剩下Stepanov先生与Meng Lee小姐(她是东方人,标准模板库的英文名称其实是取STepanov与Lee而来[2]),Lee先前研究的是编译器的制作,对C++的模板很熟,第一版的标准模板库中许多程式都是Lee的杰作。

1993年,Andy Koenig到斯坦福大学演讲,Stepanov便向他介绍标准模板库,Koenig听后,随即邀请Stepanov参加1993年11月的ANSI/ISO C++标准化会议,并发表演讲。

Bell实验室的Andrew Koenig于1993年知道标准模板库研究计划后,邀请Alex于是年11月的ANSI/ISO C++标准委员会会议上展示其观念。并获得与会者热烈的回应。

1994年1月6日,Koenig寄封电子邮件给Stepanov,表示如果Stepanov愿意将标准模板库的说明文件撰写齐全,在1月25日前提出,便可能成为标准C++的一部份。Stepanov回信道:"Andy, are you crazy?" 。 Koenig便说:"Well, yes I am crazy, but why not try it?"。

Alex于是在次年夏天在滑铁卢举行的会议前完成其正式的提案,并以百分之八十压倒性多数,一举让这个巨大的计划成为C++ Standard的一部份。

标准模板库于1994年2月年正式成为ANSI/ISO C++的一部份,它的出现,促使C++程序员的思维方式更朝向泛型编程(generic program)发展。

内容

STL 将“在数据上执行的操作”与“要执行操作的数据分开”,分别以如下概念指代:

  • 容器:包含、放置数据的地方。
  • 迭代器:在容器中指出一个位置、或成对使用以划定一个区域,用来限定操作所涉及到的数据范围。
  • 算法:要执行的操作。

容器

标准模板库包含了序列容器(sequence containers)与关联容器(associative containers)。

资料容器 描述
序列容器 - 有序集
vector 动态数组,兼容C语言数组。vector可以如同阵列一样的存取方式,例如使用下标(operator[])运算子,并记得自己的长度资讯(size),您也可以使用物件的方式来存取vector(push_back、pop_back)。使用vector可以轻易地定义多维可调整型阵列(std::vector<std::vector<...> >)。要使用vector,必须含入vector表头档。vector可在O(1)内完成在末尾插入 / 移除元素,但在vector中间或开头插入/移除元素,则需要消耗O(n)时间。
list list容器是一个有序(Ordered)的资料结构(循序容器),每个元素中存储着上一个元素和下一个元素的地址(指针),因此是一个双向链接的链表。与vector相比,其元素的访问速度较慢,而在已知元素位置的情况下,插入和删除速度较快。STL容器中唯一支持事务语义。
forward_list
(单向链表)
list的单链表版,去掉了一些操作。
deque
双端队列
可看做为能在常量时间内完成向开头或结尾插入或删除元素的vector,但是修改之后,其迭代器的有效性就无法得到保障。
array 只能在初始化时指定大小的数组,可视为内置数组的封装。
关联容器 - 无序集
set 不重复元素的集合。
multiset 跟set具有相同功能,但允许重复的元素。
map 关联数组,每个元素含有两个数据项,map将一个数据项映射到另一个数据项中。
multimap 跟map具有相同功能,但允许重复的键值。
unordered_set
unordered_multiset
unordered_map
unordered_multimap
分别类似于集合、多重集合、映射、多重映射,但使用哈希表实现。它的键(Keys)没有排序(operator<),但是必须存在一个从键类型到size_t的哈希函数、且要求键之间可以判等(operator==)。自C++11起进入语言标准。
其他类型的容器
bitset 存储系列位类似的固定大小的布尔向量。实现按位运算,没有迭代器,不是序列。可视为std::array<bool, N>。若需要改变序列长度,可用std::vector<bool>。
valarray 数值类型的std::vector。牺牲泛型能力而专为数值计算做了优化,例如在数组上的sin操作可对数组内所有数值取正弦。有些实现会对std::valarray应用向量指令等优化手段。
一个观点是里面全是数值类型的valarray才是数学意义上的向量,而可以泛型的vector更该叫array——编程语言中的数组

迭代器

迭代器是泛化的指针,通过使用迭代器,开发者可以操作数据结构而无需关心其内部实现。根据迭代器的操作方式的不同,迭代器分为五种[3]

  • 输入迭代器
  • 输出迭代器
  • 前向迭代器
  • 双向迭代器
  • 随机访问迭代器

算法

STL提供了一些常见 的算法,如排序和搜索等。这些算法与数据结构的实现进行了分离。因此,也可对自定义的数据结构使用这些算法,只需让这些自定义的数据结构拥有算法所预期的迭代器。[4]

函数对象

狭义的函数对象即重载了操作符()的类的实例,而广义来讲所有可用 x(...) 形式调用的 x 都可称为函数对象、或曰可调用对象。[5]

适配器(Adaptor)

适配器为一个模板类,用于提供接口映射。[6]

C++标准程式库的差异

一个常见的误解是STL是C++标准程式库的一部分,但事实上并非如此。例如hash table的资料结构实作在STL中有<hash_map>模板可供调用,但C++标准程式库一直到C++11才加入了<unordered_map>。参见无序关联容器_(STL)

参考文献

  1. ^ Holzner, Steven. C++ : Black Book. Scottsdale, Ariz.: Coriolis Group. 2001: 648. ISBN 1-57610-777-9. The STL is made up of containers, iterators, function objects, and algorithms 
  2. ^ # Al Stevens Interviews Alex Stepanov. [2013-10-25]. (原始内容存档于2009-05-01). After all, STL stands for Stepanov and Lee... 
  3. ^ Alexander, Stepanov. The Standard Template Library (PDF): 6. 1995 [2013-08-18]. (原始内容存档 (PDF)于2013-05-17). Depending on the operations defined on them, there are five categories of iterators: input iterators, output iterators, forward iterators, bidirectional iterators and random access iterators. 
  4. ^ Alexander, Stepanov. The Standard Template Library (PDF): 41. 1995 [2013-08-18]. (原始内容存档 (PDF)于2013-05-17). 
  5. ^ Alexander, Stepanov. The Standard Template Library (PDF): 14. 1995 [2013-08-18]. (原始内容存档 (PDF)于2013-05-17). 
  6. ^ Alexander, Stepanov. The Standard Template Library (PDF): 55. 1995 [2013-08-18]. (原始内容存档 (PDF)于2013-05-17). 

参见

外部链接