控制:一种视角——自动控制顶刊综述

本文译自控制领域顶级期刊之一Automatica的一篇综述《Control: a perspective》,业界泰斗级学者Karl J. Åström为本文第一作者。

原文链接:英文PDF下载地址

参考中文翻译:System Control(知乎),一字并肩王(知乎)

项目仓库:Github(不完全版,1-4章)

作者简介

Karl 1
Karl J. Åström

Karl J. Åström 早年就读于斯德哥尔摩的皇家理工学院 (KTH) 。为IBM研究院工作了5年后于1965年在隆德理工大学/隆德大学创建了自动控制系,被聘为该系的客座教授。他现在是隆德大学的高级教授。Åström对于控制的兴趣广博,位于国际自动化学会高引作者之列(ISAHighlyCited)。是IEEE终身会士,他的Erdös数为3。他收获了众多殊荣,包括1987年的国际自动控制联合会(IFAC)Quazza奖章、1990年IEEE控制系统奖、1993年IEEE荣誉奖章和6个荣誉博士学位。他是瑞典皇家科学院、瑞典皇家工程科学院以及美国工程院的院士。

Kumar 1
P.R. Kumar 

P.R. Kumar 来自德州农工大学。之前曾在马里兰大学巴尔的摩郡分校(UMBC)的数学系、伊利诺伊大学厄巴纳-香槟分校(UIUC)的电子和计算机工程专业(ECE)与该校的计算机科学实验室(CSL)任教。他是IEEE会士、美国工程院院士和发展中国家科学院(the Academy of Sciences of the Developing World)院士。他曾被苏黎世联邦理工大学(ETH)授予荣誉博士学位,获得过国际计算机学会(ACM)可移动系统特殊兴趣团体(SIGMOBILE)的突出贡献奖、IEEE控制系统领域奖、IEEE通信学分会的Ellersick奖、美国自动控制委员会(AACC)Eckman奖。

摘要

反馈是个古老的概念,但反馈控制却十分年轻。很久以前,大自然就发现了反馈的奥秘,因为它是生命与机体平衡所必需的。在工业革命中,反馈控制对于能源的利用至关重要,今天,反馈控制在我们身边随处可见。无论是工程师、数学家、物理学家还是经济学家都对这个领域的发展做出过卓越贡献,它是第一个系统学科(以研究系统为主要内容);它代表了一种思想变革,反馈控制不仅深刻影响了诸如航空、化学、社会治理、电气和机械等工程学科,也深刻影响了经济学和决策研究。这种以控制为核心的独特视野使它成为典型的综合性学科。本文展现了这个学科引人入胜的发展故事,也提供了观察这个学科的独特视角,还讨论了工业、应用、技术、理论和研究这几者之间的交互影响。

1 简介

很久以前,大自然就发现了反馈的奥秘。它创造了反馈机制并且在各个层次利用这些机制,它是机体平衡和生命的核心。

而控制作为一项技术至少可以追溯到两千年前。古代有很多控制的例子(Mayr,1969)。比如Ktesibios(公元前285-222年)利用一种调节水流的反馈机构来改善水钟的精度。在现代,James Watts把离心调节器应用于蒸汽机,这成为了日后工业革命的基础。自那时起,自动控制已成为19世纪和20世纪工程系统的一个关键推动因素:例如发电和输电、远程通讯、过程控制、船舶驾驶、车辆和飞机的控制、生产决策和仓储系统以及互联网上数据包流量的调节。在那些大系统中,控制器经常和传感器、执行器等独立部件共同发挥作用。

今天,控制技术在我们的家庭、汽车和基础设施中随处可见。即使在如今的后基因组时代,系统生物学研究者的核心目标也是理解如何干扰导致疾病的有害生物学路径反馈。控制理论和应用正在各个领域快速成长。

从一门古老技术到现代研究领域,控制技术的辉煌发展历程也是现代工业社会繁荣的缩影。这个调研除了具有内在利益外,还涉及到理论、技术和应用在学科发展中如何互动的细节。对于控制技术如何出现又如何发展起来这个问题,本文提供了一个视角,但绝不是包罗万象的。

为了描述这个领域,我们选取(或许有些随意)1940年、1960年和2000年作为四个时期的分界点,后面章节的题目概括了这四个时期:初识反馈控制的威力(1940年前)、学科诞生(1940年-1960年)、黄金年代(1960年-2000年)和未来体系(2000年后)。在后续的章节中,我们将展现理论与应用交互的复杂性。

直至20世纪中叶,自动控制才作为独立(虽然涉及很多学科)的学科出现。1956年国际自动控制联合会(IFAC)成立(Kahne,1996;Luoto,1978;Oldenburger,1969),1960年第一次IFAC国际大会在莫斯科召开,1962年《自动化》期刊(Automatica)出现(Axelby,1969;Coales,1969)。截至2000年,IFAC已经扩大至66个技术委员会。

控制作为一些技术领域的关键必备因素,是典型的综合性学科。这种多学科的性质在各组织中有着明确反映,如美国航空航天学会(AIAA)、美国化学工程师学会(AIChE)、美国机械工程师协会(ASME)、美国电气电子工程师学会(IEEE)、国际自动化学会(ISA)、国际建模仿真学会(SCS)和美国工业与应用数学学会(SIAM),这些组织都包含在美国自动控制委员会(AACC)和IFAC中。

控制的多学科性质的另一层含义是,当为了达到控制目的而寻找可用的理论和原则时,物理学、工程、数学、经济学和其他领域的专家都对它的发展做出过突出贡献。物理学家麦克斯韦(Maxwell)奠定了调节器的理论基础(Maxwell,1868)。后来,James、尼克尔斯(Nichols)和Phillips分别作为物理学家、数学家和工程师合著了最早的一部控制书籍(James, Nichols, & Phillips, 1947)。数学家理查德.贝尔曼(Bellman, 1957b),Solomon Lefschetz(Grewal & Andrews, 2010) 和L.S.庞特里亚金(Pontryagin, Boltyanskii, Gamkrelidze, & Mischenko, 1962)对现代控制理论的早期发展做出了贡献。确实,对于数学严谨性的尊重是控制系统研究的特质,这一点或许是从电路理论那继承而来(Bode, 1960; Guillemin, 1940)。

控制理论就像工程科学的其他分支一样,它的发展模式和诸多自然科学相同。虽然自然科学与工程科学有强烈的相似性,但也存在一些基本差别。一方面,自然科学的目标是理解自然现象。它的核心目标是找到自然规律,成功的人会得到名望和诺贝尔的奖励。自然科学向来十分推崇简化主义,需要隔离特定现象,一个极端的例子就是粒子物理学。但另一方面,工程科学要理解、发明、设计和维护人造工程系统。一个主要挑战是发现那些有助于有效理解和设计复杂物理系统的原理。反馈,作为控制的核心,就属于这类原理。虽然纯粹的简化主义已经在自然科学取得极大的成功,但它对于工程科学却不那么给力,因为对于工程系统来说,相互的联系是必需的。

各种周年纪念日时往往会发布关于控制的综述文章。

IFAC于2006年9月在Heidelberg举办了一个研讨会来庆祝它成立50周年(IFAC, 2006)。

《自动化》期刊于2014年庆祝了它成立50周年(Coales, 1969)。

在国际自动化学会(ISA)的59周年庆典上发布了一篇通俗的关于传感器和工业控制器的综述(Strothman, 1995)。

美国机械工程师协会(ASME)在1993年发表了一系列关于控制历史的论文,这些论文的发布与《Journal Dynamic Systems, Measurement, and Control》杂志的50周年庆典密切有关(Rabins, 1993)。

IEEE控制系统学会支持了由编委会挑选出的25篇经典控制理论论文的重印工作(Başar, 2001)。

《The European Journal of Control》杂志在2007年1月发表了一个专栏:X世纪控制科学的黎明和发展,在专栏中研究者们反映了他们关于控制科学发展的看法(Bittanti & Gevers, 2007)。

一篇关于控制系统工程历史的专栏发表于1984年,此时正值IEEE百周年纪念。

IEEE控制系统学会2009年在德国的Berchtesgaden组织过一次关于控制影响的研讨会:过去、现在和未来。来自研讨会的材料汇集了大量的成功案例和重大挑战,它们被总结进一个通俗报告(Samad & Annaswamy, 2011)。

美国工程院(National Academy of Engineering)发表了两本关于世纪之交未来工程的调研报告(NAE, 2004, 2005).)他们指出了系统与日俱增的重要性和建模仿真在基于计算机的设计与工程中所担当的重要角色。

美国空军科研办公室(AFSOR)资助了关于控制、动力学与系统未来方向的一系列调研,得出了一个通俗报告(Murray, 2003),这个报告是由Murray, Åström, Boyd, Brockett和 Stein(2003)总结的。

控制这个领域甚至在吸引着不少历史学家的目光,或许这意味着控制的复杂发展过程需要被澄清。有的书关于控制的历史(Bennett, 1979, 1993; Bissell, 2009), 有的书关于个人研究者(Hughes, 1993), 还有的关于组织和工程(Mackenzie, 1990; Mindell, 2002, 2008)。在很多控制会议中也安排有讨论这个领域历史的分会。

但令人不解的是,虽然控制技术被广泛应用,但在专家群体外却不常提到;实际上,控制有时被叫做“幕后技术”(Åström, 1999)。其中一个原因可能是它把自己隐藏的十分出色,以至于全部注意力都被最终的设备产品所吸引。相比于讨论设备本身,讨论设计思路比如反馈则更加困难。另一个原因是控制学家还没有对于科普写作给予足够的关注,除了1952年科学美国人杂志青睐于“自动控制”这个专题,这是个突出的例外(Brown & Campbell, 1952; Tustin, 1952)。

截至1940年,控制已经大范围地应用于电气系统、过程控制、远程通信和船舶驾驶。数千个调节器、过程控制器、陀螺-罗盘系统和陀螺驾驶仪投入应用。控制器是基于机械、液压、气动和电气技术的专用模拟装置。反馈的思想广泛用于从非线性元件获得鲁棒的线性行为,电子模拟计算正在兴起;最初发明它是用来模拟控制系统(Holst, 1982)。对于过程控制和火力控制系统,中心控制机房的需要驱动了通信技术的发展(Holst, 1982),控制展现的力量所带来的收益成为发展这项技术的驱动力。

在这个时期,虽然不同工业中的基本原则是相似的,但系统的共性却没有被人们广泛理解。一个让人有些惊讶的例子就是,诸如积分和微分行为的特点在不同应用领域反复被发明和多次申请专利,而它们的理论基础是线性化模型和劳斯-赫尔维茨稳定性判据。一些相关教材已经出现(Joukowski, 1909; Tolle, 1905)。这时期的研发主要在工业部门进行。

经历了第二次世界大战期间的发展,控制在1960年成为了一个专门领域。伺服控制理论成为了它的理论基础。基于数据的建模工具即频率响应的使用、分析与综合方法这时都得到确立。模拟计算机既被当作一种控制器应用技术,也用作仿真工具。

很多发展是由应用和实际需求所驱动。经历了长期和复杂的进化后,才终于产生了理论与应用乃至不同领域应用的整体性观点。控制系统大量投入应用,大型公司设立了控制部门,而且有的公司则专营控制。国际组织IFAC宣告成立,它的第一次大会于1960年在莫斯科召开。这个时期主要的研发是在专门的研究机构或以一些大学与工厂合作的方式完成的。截至1960年,关于控制的书籍数量已经达到60多本。

但是,很多改变起始于1960年前后;数字计算机、动态规划(Bellman, 1957b)、控制的状态空间方法(Kalman, 1961a)和线性二次型调节器(Kalman, 1960)出现了,而卡尔曼(Kalman)滤波器也即将登场(Kalman, 1961b)。控制的发展开始活跃,因而这个时期被誉为黄金时代。这个时代的挑战来源于太空竞赛、计算机控制引入过程工业中以及很多其他应用,例如汽车和便携电话。这个时期,应用增长快速、理论进展非常活跃,很多附属专业也随之发展。相关大学教育在本科和研究生层次迅速扩大。这些现象导致的一个结果是经历数十年而取得的理论与实践间的平衡被再次破坏,但这一次失衡的方向却与上次相反。纯理论很大程度上抓住了人们的注意力,并且在一些人中出现了一种观念:“鸿沟”出现(Axelby, 1964),整体观点已经丢失(Bergbreiter, 2005)。

关于最近的事件当然很难提供一个很好的视角,但我们的观点是:有迹象表明有其他的重要发展和突破正在进行。截至大约2000年,由于有线和无线网络的出现和增殖、传感器的发展、计算机功能逐渐强大和软件功能的日趋复杂,技术方向已经出现了变迁。那么在世纪之交出现了新的挑战:网络控制与基于网络控制、可验证的安全嵌入式系统设计以及复杂系统的基于模型设计和自主性。技术戏剧性的发展提供了很多机遇,也呈现出很多挑战,应对这些挑战需要控制同计算机科学和通信紧密集成到一起。这个认识产生了很多重要研究项目,例如欧盟的ARTIST2和ArtistDesign项目聚焦于嵌入式系统,还有美国的信息物理系统(Cyber–Physical Systems)(Baheti & Gill, 2011)。

物理、生物和医药正在更加紧密地互动。控制在诸如自适应光学和原子力显微镜等设备中成为关键因素。量子和分子系统的控制也正在探索。使用系统与控制的观点可能获得更深的生物学视野,对于这类需要和兴趣逐渐增加。在系统生物学领域已经出现了拥有控制科学家和生物学家的共同团队;值得一提的是工程学院也设立了生物工程系。

2 初识反馈控制的力量

工业革命的推进需要动力,尤其需要可控的蒸汽动力。因此控制在工业革命期间获得极大发展。反馈控制是一种强有力的工具,它能减小外部干扰和变化的影响,从而可以用性能差的组件构建一个性能良好的系统或者使不稳定的系统稳定。反馈控制可能带来的主要问题是会产生系统的不稳定性,识别和解决这些问题使得控制得到重大发展。随着工业革命进行,新的工业和技术革新让控制学成为电子、化工、电信和其他工业的核心部分。从此控制和工业革命就紧紧的联系到一起了。

2.1 离心调速器

此时在风车的操作上,已经出现对控制设备的需要。如果我们回溯到1745年,那时发明的离心调速器就是为了风车保持恒定转速运行(Mayr, 1969)。类似的需求也出现在使用蒸汽动力的纺织业,他们需要使织布机和其他机器保持恒定转速。瓦特成功地改造了离心调速器,将其用于蒸汽机,并在1788年申请了专利。

离心调速器包含传感、执行和控制三个环节。调速器的设计是一个折中办法:需要沉重的飞球产生大的驱动力,但同时也会导致反应迟缓。实践上还遇到了机械设备中摩擦力和间隙的难题。基本的调速器产生比例作用,因为飞球连杆与转轴的角度同转轴速度成比例关系。这样的调速器会产生稳态误差,但是具有积分作用的控制器具有一个显著的特性,即当闭环系统稳定时,它总是接近正确的稳态。

1790年左右,Pérrier兄弟设计的调速器中引入了积分作用。他们使用一个液压装置,在装置中,流入容器的液体量和速度成比例关系,而且蒸汽阀由液位控制(Mayr, 1969, p. 110–113)。1845年,Werner和William Siemens通过差速齿轮引入了积分作用(Bennett, 1979, p. 21–22)。Siemens兄弟还基于惯性轮引入了微分作用。自此调速器成了蒸汽机不可分割的一部分,而在18世纪末的后200年里,调速器也得到了发展。Bennett对此进行了详细的描述(Bennett. 1979)。

对调速器的理论研究是从麦克斯韦(Maxwell)的论文开始的。他分析了线性模型,还证明了积分作用的优点。他同时发现可以通过闭环系统特征方程的根确定系统的稳定性。麦克斯韦推导出三阶系统的稳定性判据并求助于劳斯(Routh),后者解决了一般性的问题(Routh, 1877)。

Vyshnegradskii独立于麦克斯韦分析了带有调速器的蒸汽机,也开发出一个三阶系统的稳定性判据(Vyshnegradskii, 1876)。Vyshnegradskii的工作是工程导向的,而且与调速器的设计紧密结合。他受过成为一名数学家的良好教育,同时还是圣彼得堡国立技术学院的主任。在那里他开创了有深厚科学基础的机械制造课程。最后在沙皇俄国财政部长的任上结束了他的事业生涯(Andronov, 1978)。

Vyshnegradskii的研究成果被Stodola用来设计水轮机调速器。他用到了更复杂的模型还求助了他在苏黎士联邦理工学院(ETH)的同事赫尔维茨(Hurwitz),后者主要帮助做稳定性分析。

赫尔维茨用不同于劳斯的其他方法推导出一个一般性的稳定性判据(Hurwitz, 1895),即今天众所周知的结论—劳斯-赫尔维茨判据。Stodola还引入了无量纲变量和时间常数。Andronov(1978)、Bennett(1979)、Bissell(1989)和Profos(1976)提供了关于麦克斯韦和Vyshnegradskii工作的有趣观点。这时的科学家们很少互动(Gantmacher, 1960, p.172–173)。劳斯和赫尔维茨没有意识到彼此的贡献,而且他们也采用了不同的数学技巧 (Lyapunov,1892)。Stodola只是在他后来的文章中提到了劳斯(Andronov, 1978)。

19世纪初期对带调速器的机器进行控制的工程学基础牢固建立。许多公司发明和制造了调速器。据Bennett(1979, page74)讲,在1868年,英格兰安装了75000多台调速器。人们理解了比例积分和微分的作用并将其应用在机械和液压装置上。这些理论基础是建立在麦克斯韦、Vyshnegradskii和劳斯-赫尔维茨判据的研究成果上。控制的教育是从少数大学开始的。Tolle在1905年将研究成果编辑到教科书《Der Regelung der Kraftmaschinen(Control of Power Machines)》中。分析和设计都是在线性化和检验特征方程根的基础上。在1909年,莫斯科大学的空气动力学家Joukowski出版了第一本控制方面的俄文书《The Theory of Regulating the Motion of Machines》。

2.2 发电和输电

电力工业诞生于十九世纪后期,并在二十世纪初得到飞速增长。最初,电是由水涡轮或锅炉-涡轮机组产生的,并分布于本地的直流电网中。涡轮和锅炉的控制是2.1节讨论内容的主要应用领域。虽然调速器的早期发展很大程度依赖于经验,但是电力行业需要一种更系统的方法。

Vyshnegradskii的论文(Vyshnegradskii, 1876)对工程实践具有重大影响,并广泛应用于涡轮控制系统(Andronov, 1978)。Tolle的书(Tolle, 1905)在1909和1929重印了2次,并在很长一段时间内作为电力控制的标准文献。

生产和消耗差额的增加产生了新的控制问题。许多发电机接入大型电网,目的是提供充足的电力和提高可靠性。随着电网的扩张,挑战出现了。所有发电机经直流转交流传输后都必须进行同步,因而在频率和电压控制方面就会遇到问题。为了安全运行,必须了解发电机对负载变化、故障、雷击等干扰的响应。

在18世纪后期,Charles Steinmetz通过在交流电分析中引入“复数”和相量,奠定了交流电分析的基础(Steinmetz, 1916)。但这项工作只能解决稳态行为,并不能处理动态系统。针对这一情况,工作于麻省理工学院Vannevar Bush手下的Harold Hazen在上世纪20年代末构建了一个“网络分析仪”。该分析仪是一个电力系统的实验室模型,使用相移变压器和传输线构建,并可使用电话交换机的插板重新配置。通用电气(General Electric)和其他电力公司仿制了这套系统。

电力行业的出现改变了以前的竞争规则,因为它是由大型工业同扮演重要角色的公共和国家公用事业联合发展的。由于需要安全地运营大型网络,公用事业和电力公司都设立了用以理解、设计和运营电网的研发团队。这些公司包括通用电气,西屋电气(Westinghouse),瑞典通用电气(ASEA),英国广播公司(BBC),阿尔斯通(Alstom),以及欧洲很多公共和国家公用事业公司,如意大利国家电力公司(ENEL)、法国电力公司(EDF)和瑞典国家电力局。作为研发团队中的一例,由托马斯.爱迪生(Thomas Edi)、Willis R. Whitney和Charles Steinmetz在1900年创立的通用电气研究实验室,是美国第一个工业研究实验室。

2.3 工业过程控制

过程和制造工业的自动化发轫于十九世纪末期,并在二十世纪初加速发展。化工、石油、造纸、制药工业的生产过程需要精确地控制压力、温度和流量以得到好的产品质量。锅炉、反应堆、精馏塔、混合器和搅拌器是典型的工业过程。人们研发了多种传感器用来测量不同物理量,而执行器通常是阀门和泵,气动技术成为实现传感、驱动和控制功能的常用技术。传感器和执行器必须安装在工业过程的环境中。最开始,控制器也和工业过程设备安装在一起。它们通过压力信号与传感器和执行器通信。连接器、压力管和信号电平(3至15 psi)都是标准化的,允许不同供应商的设备组合在一起。随后,控制器被组合并移动到中央控制室,在那里还提供信号记录器,大大简化了操作员的工作和工作环境。

那时的控制器发展并不是由理论推动的,而是大多基于工程应用方面的考量。通过修葺,人们重新发现了积分和微分的效用。对泰勒仪器公司(Taylor Instrument Company)齐格勒(John Ziegler)的采访(Blickley, 1990)给出了这样的观点:

“研究部门的某个人正在修补Fulscope(一个气动PI控制器),不知何故,胶囊的反馈线受到了限制,这个限制产生了波纹管中的跟随特性。他注意到这个方法对于输出有奇特而显著的作用。他们在人造纤维粉碎机上试验了这个方法,获得了完美的温度控制结果。”

控制器组件也被用作气动模拟控制器来仿真工业过程。因为模拟器使用了气动信号,所以可以很方便地连接到气动控制器。反馈在传感器、执行器和控制器本身中广泛使用。关键思想是用高增益的气动放大器以限制量的形式把被动部件组合起来,从而产生优良的线性行为。这同后面2.6节讨论的反馈放大器十分相似。

控制器开始变成一种标准化的通用型设备,而不再是为像调速器这样的特殊过程而构造,并且它们还配备了刻度盘来调节PID控制器的参数。最早的通用型PID控制器是由Foxboro研发的Stabilog,它的增益可以在0.7~100之间调节。它在1931年出现,很快其他厂商就开发了相似的产品。因为同一个过程可能会用到很多控制器,因此人们需要一种为不同过程的控制器寻找合适参数值的方法。齐格勒和尼克尔斯发展了一套整定准则(1942),仅需在这些过程中做一些简单的实验就可以确定控制参数。

传感器、仪表和控制器的出现使得一些新公司随之诞生。工业界变得高度多样化,到二十世纪三十年代中期已有超过600家控制公司,其中的领头羊包括Bailey、Brown、Fisher & Porter、Foxboro、Honeywell、Kent、Leeds & Northrup、西门子(Siemens)、泰勒仪器和Yokogawa(Strothman, 1995)。Bennett(1993, p. 28)估计在1925-1935年间美国共卖出了约75000个控制器。

过程控制的工业结构与通信和电力行业是不同的。想法并没有得到广泛传播,而是作为商业机密被保护起来。过程控制领域有大量的公司。通信和电力行业可获得的集中资源正是过程工业所缺少的,就像前两者缺少理论基础一样。

2.4 船舶驾驶

在船舶驾驶中有很多有意思的发展事例。由于大型船舶需要很大的力量去转动船舵,所以驱动成为了一个关键的问题。“伺服电机”一词由发明液压舵机的法国工程师Farcot所创造(Bennett, 1979)。这些提供驱动的装置是实现船舶驾驶自动化的重要组成部分。同时这一时期的控制也得益于传感器的进步。

在船舶驾驶方面取得的重大进展受到了陀螺效应的启发。基于陀螺效应萌发的想法和发明的装置已经产生了重要的影响,被称为“陀螺文化”(Mackenzie, 1990; Mindell, 2002, 2008)。

首个陀螺罗经是由Anschütz-Kaempfe设计的,他在1905年创立了Anschütz公司。这个公司与Max Schuler合作,Max Schuler是哥廷根大学应用力学研究所的负责人,他使用了一种巧妙的方法使得陀螺罗经对于船舶运动不敏感(Schuler tuning)(Schuler, 1923),同时他也在大学教授控制课程(Magnus, 1957; Schuler, 1956)。

1910年,Sperry创立了Sperry陀螺仪公司,该公司主要研究陀螺罗经与基于陀螺仪的很多其他装置。几年以后,Brown公司也开发出了陀螺罗经,并因为知识产权同Anschütz打了几场官司(Mackenzie, 1990)。Sperry把陀螺罗经与电机连接到方向盘上获得了陀螺驾驶仪,通过观察有经验的领航员,Sperry发现:

“一个有经验的舵手应该会‘压舵’,也就是先回舵再将舵盘停在与回舵方向反向的位置,从而防止船舶的角动量过大使船舶错过它期望的航向。”

Sperry尝试利用这种方式开发了一个机电设备,这个设计被妥善记录在Bennett(1979),Hughes(1993),和Mindell(2002)的著作中,他设计的是一个典型的PID控制器。压舵的函数通过微分作用获得,积分作用通过电机驱动方向盘获得。作用的大小常常基于开关设备,利用反馈获得线性行为。

Sperry陀螺驾驶仪缓解了舵手通过调整舵来保持航向的乏味工作。陀螺驾驶仪可以调整控制器参数,也可以设置目标航向,还有一个杠杆可以连接和断开陀螺驾驶仪。Sperry的陀螺驾驶仪绰号为“Metal-Mike”,它是非常成功的。Sperry还提供了记录仪以便对比自动和手动驾驶的误差。到1932年为止,已经有超过400个该型系统投入应用(Hughes, 1993)。

在船舶驾驶方面,一些有意思的理论进展要归功于在圣彼得堡皇家技术学院就读的Minorsky(1922)。他提出了控制器的分类,并推荐在船舶航向控制中使用PID控制器。他的设计方法基于简单的线性模型,即今天我们所谓的极点配置法。Minorsky 测试了组建的自动驾驶仪,但是它没有商品化,而是把他的这个专利卖给Bendix(Bennett, 1993)。后来Minorsky成为了斯坦福大学的教授,并写了一本关于非线性振动的书(Minorsky, 1962),在Bennett的书(Bennett, 1979, p.147–148)和文章(1984)中,讨论了Sperry、Minorsky和Anschütz的贡献以及他们在自动驾驶仪设计方面的影响。

船舶驾驶中新的控制问题出现在第一次世界大战期间,同海军现代化计划有关(Bassett, 1950):

“由陀螺罗经和数据发送中继器触发,自动将目标方位,炮塔角度,真方位角和船舶航向从甲板发送到绘图室再到炮的可能性,开拓出了新的广阔领域。

目标方位和距离通常由船上光学设备测得。目标的预期位置可以计算得到,大型炮塔可以通过伺服机构瞄准。同步电机将信息从光学设备发送到计算机,或从模拟计算机发送到伺服机构。那时的计算机是使用盘-轮式积分器的模拟机电设备(Mindell, 2002),由福特仪器公司(Ford Instrument Company)、通用电气公司和Sperry公司生产。

2.5 飞行控制

在19世纪时,人们完成了许多载人飞行试验。莱特(Wright)兄弟成功的一个原因是他们理解了动力学和控制之间的关系。1901年,威尔伯.莱特(Wilbur Wright)在美国西部工程师学会(Western Society of Engineers)演讲时,表述了如下这个观点(McFarland, 1953):

“人类已经知道怎样制造机翼 … 人类也知道怎样制造引擎 … 研究飞行问题的学生面对平衡和操纵仍然无能为力…当这个问题被解决的时候,飞行的时代也将到来,因为其他的问题都是次要的。”

莱特兄弟通过将他们的洞察力与熟练的试验技巧相结合,1905年实现了第一次成功飞行。1955年5月19日,Charles Stark Draper在皇家航空学会(Royal Aeronautical Society)举办的第43届威尔伯.莱特纪念演讲(Draper, 1955)中提出了他们成功的一个有意思的观点:

“莱特兄弟否定了‘飞行器应该天生稳定以便飞行员只需操纵飞行,而不需要维持稳定’的理论。相反,他们特意制作了不稳定的飞机,依靠飞行员操纵可动舵面使得“飞行员+飞机”整个飞行系统稳定。最终,机动性和操控性增加了。”

莱特飞行器(Wright Flyer)的不稳定现象刺激了自动驾驶仪的发展(Hughes, 1993)。Sperry根据他对陀螺仪和船舶自驾仪的理解设计了飞机自驾仪。姿态的偏差由陀螺仪感知,方向舵和副翼由气动部件驱动。1912年在巴黎举办了规模宏大的自驾仪竞赛,Sperry的儿子Lawrence不用手操作实现了贴地飞行。同时,他的机修工在翅膀上行走来展示自驾仪能够应对干扰。

莱特兄弟的成功是我们现在所说的集成过程控制设计的早期案例。其核心思想就是自动控制给予设计者额外的的自由度。莱特兄弟制造了机动性强的飞机,这种飞机依靠飞行员的操作达到稳定。Minorsky也深刻体会到这些问题,他一语道破(Minorsky, 1922):“古谚云:稳定的船只难驾驶。”人们观察到的有趣现象是,现代高性能战斗机往往被设计成不稳定的;这类飞机依赖于自动控制系统来稳定。

随着自驾仪的发展,德国兴起了繁盛的陀螺仪文化(Oppelt, 1976)。Lufthansa于20世纪20年代进行了国际长途飞行,这就带来了方向控制的需求以便在所有天气条件下安全飞行。德国的Askania、西门子和Möller–Patin公司开发了与Sperry设备竞争的自驾仪。

Sperry继续开发自驾仪,精炼后的A-2模型使用了空气驱动陀螺仪和气动液压执行器。1933年,Sperry的A-2自驾仪用于Wiley邮政(Wiley Post)的单人环球飞行,这次飞行公开展示了自驾仪的优势。早在20世纪30年代,航空公司就开始引入自驾仪,像Bendix和Honeywell这些公司也开始制造自驾仪。

自驾仪在分立组件和整个系统中都大量使用了反馈。虽然早在1911年,基于线性方程和特征方程分析的飞行动力学已经有了良好的理论基础。但是,直到20世纪50年代中期,理论工作才对实际的自驾仪设计产生影响(McRuer & Graham,1981)。原因之一是缺少计算工具。就像船舶驾驶一样,那时的工程能力比理论重要的多。

2.6 长途电话

Graham Bell在1876年为电话申请了专利。最初,电话是通过转接板连线到中转中心的。随着电话的数量急剧增长。许多通话是用分频的方法在同一线路中传输的。电话行业集中程度之高甚于电力行业,因为它是由私有公司或国家垄断组织和行业所推动的。

横贯美国大陆的电话行业的增长是通信也是间接而深刻的驱动力之一(Mindell, 2002)。1887年左右,Oliver Heaviside表明增加线路中的电感可以减少信号传输中的失真。1899年,哥伦比亚大学的 Mihajlo Pupin申请了加感线圈(loading coil)的专利(Pupin, 1899),与此同时,AT&T的George Campbell在1900年将加感线圈改进并应用在了电话线路上。这项技术随后被用于长途线路和线缆上。但是,长途信号是被动传输的,同时加感线圈技术在1911年左右达到了它允许的信号失真和衰减的极限。该项技术在纽约丹佛的线路上进行了使用。在1913年,AT&T买下了当时由Lee de Forest在1907年发明的三极管技术(Lee_De_Forest, 1906),并将其由Harold Arnold进一步开发。它使用了八个中继放大器连接纽约和旧金山,将线路从丹佛延长到了加利福尼亚。中继器的数量因更多的城市互联而增加,但就像Bode所指出的(1960),失真在这之后成为了一个主要的问题:

“大家都对自家高保真系统的音频放大器毫无疑问地感到骄傲,但是我估计你们当中很少有人会愿意听那种信号经过几十甚至几百个放大器(即使是你们家里那种良好的)串联后得到的声音。”

因此,采用能增加电话线路的负载能力的多路复用技术就有了巨大的推动力,这项技术连同电缆的使用大大增加了对中继器的需求,也需要高质量的低失真放大器。在当时,主要的放大装置还是电子管,但是它有着非常严重的缺陷,比如随着时间变化的非线性特性。在当时,有很多人尝试着去解决这个问题,但直到1927年贝尔实验室的Harold Black开发了负反馈放大器才取得实质性进展(Black, 1934)。其核心思想是利用无源线性原件为放大器提供反馈以减小失真。在这里引用Bode的一段文字(1960):

“引起失真的原因有很多种,包括电源噪声,增益变化等。但决定性问题却是由终端管子的轻微非线性引起的互调(inter-modulation)。为了改善该状况做了很多种不同的尝试,如选择不同的管子,仔细调节偏移量,通过匹配管子的推拉来提供补偿特性。但在Black的发明出现之前,没有一个方法对这种情况做出实质改善。”

值得注意的是,Black指的“稳定”是用来描述放大器的增益不因温度变化、下雨、天气和原件老化等原因而变化的常值性,却不是描述它对“啸叫”或者振荡的免疫性(Black, 1934)。反馈可以利用有不良特性的原件制作优良的放大器。在这项发明五十年之后,Black在他的论文中对他的发明给出了这样的观点:

“我突然意识到,如果我把放大器的输出以相反地相位反馈给输入,并且保持设备不振荡(那时我们称之为啸叫),我将得到我正想要的一种消除输出失真的方法。 …构建一个增益被刻意定制的放大器,也就是说比必要的高出40分贝,接着将输出反馈于输入从而抛弃了多余的增益,我们发现这样对放大的常值性和摆脱非线性产生了异常的提高。”

Black的专利花费了九年才被授权,一定程度上是因为专利授予官员不愿相信放大器能够正常工作。他们不相信一个回路增益高达数百的反馈回路是稳定的(Black, 1977)。

不稳定或“啸叫”常常出现在反馈放大器的试验中。因此,长途电话通信的技术挑战带来了反馈回路的稳定性问题。1932年,亨利.奈奎斯特(Harry Nyquist)就遇到了这个问题,当时他和Black参与了一个联合计划,要测试新的载波系统中的负反馈放大器。为了解决这个问题,奈奎斯特用了与麦克斯韦和Vyshnegradskii稳定性结果完全不同的方法。他探索了正弦信号如何沿着控制回路传播,而不是分析特征方程,由此产生了“奈奎斯特判据”。电子放大器的稳定性是由Kupfmüller (1938)独立研究的。他引入了信号流图,并用积分方程分析电路。

通信的性能要求需要反馈回路的设计方法进一步发展。Hendrik. Bode在1934年设计均衡网络时,深入考察了反馈放大器。他研究了衰减和相位之间的关系,并引入了增益和相位裕度以及最小相位的概念(Bode, 1940)。他还证明了控制系统设计的基本局限。特别是,他证明了灵敏度函数幅值的对数积分是常值,这意味着控制本质上是一种折衷:减小一个频率的灵敏度,就会增加另外一个频率的灵敏度。他还证明了如果系统不是最小相位,甚至存在更加严格的限制。Bode还发展了基于图方法(Bode图)设计反馈放大器的工具,即今天所谓的环路整型。处理三极管增益的大变化特别困难。他表明,对于很大的增益变化,通过整形环路传递函数可以保持恒定的相位裕度,使得Nyquist曲线贴近一条经过原点的直线,他称其为“理想截断特性”。Bode的设计方法是鲁棒控制的第一个案例。他的研究结果基于复变函数理论,汇总在他的重要著作(Bode, 1945)中。

AT&T公司开始把工业研究实验室作为其控制美国电信行业战略的一部分。为了执行这一战略,他们想通过获取或防止他人获得关键专利来控制技术变革的速率和方向。他们的研究实验室在确保AT&T持有技术和专利权的控制方面发挥了重要作用(Bennett, 1993, p. 70–71)。在贝尔实验室的环境里,混合着像Bode、香农(Shannon)和奈奎斯特一类的科学家和像Black一类的工程师,这里是技术发展和基础研究的沃土。贝尔实验室已经有13位诺贝尔奖获得者。对这些人物和研究环境的观察体现在Mindell的书中(Mindell, 2002)。

控制用于电信行业和其他行业的主要区别在于,前者是由研究实验室和许多有资质的研究人员支持的。在这个行业中,理论与实践相互交织,用于陆地线路和水下电缆的中继设备被批量生产。

2.7 早期的机电计算机

人们很早就认识到,计算机可以在缺少数学解时模拟动态系统并了解其行为。实际上,对微分方程积分的机械设备已经在1876年由威廉汤姆斯(开尔文勋爵)(Thomson,1876, 1878)设计出来了,他使用球盘摩擦式积分器来执行积分运算。为了模拟电力系统网络, Vannevar. Bush显著地改善了机械设计,并设计了扭矩放大器来避免过载(Paynter, 1989)。Bush的第一个机械式微分分析仪具有六个积分器(Bush, 1931)。在麻省理工学院,该微分分析仪还被用于电力系统以外的各种应用中。

首先是“乘积分器”,这是一个用来对两个函数的乘积进行积分的设备(Bush, Gage, & Stewart, 1927),它是网络分析中一个重要的组成部分。这个设备需要人工跟踪函数的每一个输入波形,接着这些波形会产生一个电子信号送到一个输出为转动轮的电能表。 如果此次计算的输出要用作下一次的输入,为了避免轮子过载,使用一个伺服电机来复制此动作。它在电话网络中作为放大器中继器的机械模拟。1931年时发展到下一阶段,此时人们将伺服机构后面的积分器输出信号反馈到输入端,这样就具有了求解微分方程的功能。伺服机构在连接实现计算的各环节中发挥了关键作用。因此,控制在构建早期的机电模拟计算机中扮演了核心角色。

反过来,这种“计算机 ”的开发促使Hazen (Hazen,1934a)继续进一步研究伺服机构。然而这项研究表面上并没有同早期奈奎斯特和Bode的工作关联起来。但他引用了更早的Minorsky的工作,后者曾在美国海军船只的驾驶中引入了PID控制器(Minorsky,1922)。贝尔实验室早期也进行了伺服系统的研究工作(Bomberg&Weber, 1941; MacColl, 1945)。

接下来的新式微分分析器的代表是“洛克菲勒(Rockefeller)”微分分析器,此微分分析器以电子方式传输数据,因此可以通过重置电话交换机而不是通过更耗时的机械转轴对系统进行重新配置,这个项目是由洛克菲勒基金会的Warren Weaver在麻省理工学院资助的。这种合作伙伴关系在后来的防空火力控制发展中扮演了非常重要的角色。这台计算机“编程”使用打孔纸带,使它成为’“复合”的数字/模拟系统。受此启发,克劳德.香农(Claude Shannon)在他麻省理工学院硕士毕业论文中研究了的开关电路问题并且展示了布尔代数如何用于设计(Shannon, 1938)。后来,George. Sibitz 以他的工作为基础,在数字计算机方向取得了进展。香农后来研究了可以被微分分析仪解决的一类问题(Shannon,1941年)。

几所大学和研究机构制造了微分分析器的复制品。在麻省理工学院时,尼克尔斯使用了微分分析仪,开发了用于PID控制的整定规则(Blickley,1990)。曼彻斯特大学使用了模拟计算机来分析带延迟系统的控制(Callender, Hartree, & Porter, 1935)。

1938年,Foxboro公司的George. Philbric发明了电子模拟计算机,名为Polyphemus,用于仿真过程控制系统(Holst, 1982)。该系统被广泛用于Foxboro公司的培训和演示。模拟计算随后将在控制领域产生重大影响。

3 学科诞生

在第二次世界大战之后,控制作为一门独立学科正式登上历史舞台。战争之前就有人意识到科学可能会对战争的结果起到决定性作用。火力控制系统,枪炮瞄准器,船用、机用和鱼雷自驾仪都被研制出来。在过程控制方面也取得了重大的进步。军事机构,工业界,研究实验室与大学紧密合作(Mindell, 2002; Oppelt, 1984)。工程师以及来自不同专业且有着控制系统经验的研究人员汇集起来组成了跨学科的团队。人们认识到,即使应用领域十分多样化,但是所有的控制问题都有一个共同的基础。

火力控制是主要的挑战之一。城市,工厂以及轮船都需要枪炮的保护以免受飞机的袭击。雷达被用作传感器,电动机或液压马达则用来改变枪炮的方向。但由于雷达和枪炮物理上是分离的,两者之间的通讯必不可少。由此产生了一个额外的难题——雷达信号的噪声很大。船上的火力控制也必须对船的运动作相应的处理。早期的火力控制系统使用手动控制,但由于飞机的速度提高,导致无法使用手动控制。但是,可以通过机械模拟计算机,实现自动瞄准。反馈在系统水平与组件水平上都得到了广泛的应用。

德国在控制领域有着很悠久的传统;早在1905年,Tolle的教科书(Tolle,1905)就已经面世了。德国工程师协会(VDI, Verein Deutscher Ingenieure)也已经意识到控制的重要性,于是他们在1939年组织了一个关于控制工程的委员会,由Hermann Schmidt担任主席,Gerhard Ruppel担任秘书。

凡尔赛条约对于德国的军事活动有着严格的限制;例如,禁止拥有空军。尽管如此,德国依然有着许多的秘密的项目。飞机以及导弹的自驾仪得以研制出来(Benecke&Quick, 1957; Oppelt,1984)。德国海军在1926年成立了一个秘密的公司“Kreiselgeräte”(陀螺仪装置)。这家公司在整个第二次世界大战期间的导航与制导方面扮演着核心的角色(Gievers, 1971; Mackenzie, 1990)。包括Askania、Kreiselgeräte和西门子在内的许多公司到1940年都制造了自己的自驾仪,在大学内也出现了一些重要的活动。根据Oppelt(1976)记录,每个月都会有数以千计的自驾仪生产出来。直到战争结束,仅西门子一家公司就制造了35,000个自驾系统。自驾仪的基础是陀螺仪和模拟计算,使用了气动,液压和机电技术。

德国军方秘密地创立了弹道学委员会(Ballistics Council)来研制军事火箭。这个由Walter Dornberger领导的项目起始于1930年,并在1937年转移到佩讷明德(Peenemünde)。这个项目小组当时大约有90名研究人员(Benecke &Quick, 1957; Klee, Merk, & von Braun, 1965)。而制导与控制是其研究的关键部分。该项目组研发出了包括V-1巡航导弹以及V-2弹道导弹在内的一些导弹。制导系统需要大量的研究与开发。Askania公司研发并制造了V-1导弹的自驾仪。V-2导弹及其制导系统则由Wernher von Braun领导的团队研发出来(Benecke & Quick, 1957)。二战期间总共发射了超过8000枚V-1导弹与3000枚V-2导弹。战争结束以后这些德国的火箭专家陆续去了美国或者苏联,并在导弹技术的发展中起着领导作用。

苏联在1957年发射了第一颗人造地球卫星斯普特尼克一号(Sputnik),由此触发了太空竞赛。第一个到达月球的火箭是1959年苏联的月球(Luna)2号。苏联国内的研究都是高度集中的(Bissell, 1992b;Kurzhanski, 2007)。研究由科学院指导,并且由电工学院、锅炉和涡轮学院、电力工程学院以及航海航空学院等大的工科学院负责应用。如果追溯到Vyshnegradskii, Joukowski和李亚普诺夫(Lyapunov),可以想象苏联在自动控制领域也有着悠久的传统, 李亚普诺夫的书早在1892年就出版了,Joukowski的也在1909年出版。

控制同样受益于苏联各地高校中对非线性动力学研究的优良传统,在莫斯科有由Mandelstam和Andronov领导的研究小组(Andronov, Vitt, & Khaikin, 1937),在基辅则有由Krylov和Bogoloibiv领导的团队。1934年创立远动(远程控制)与自动化技术委员会,由A. A. Chernyshov担任主席。1936年召开了一个关于自动控制与调度设计的全苏会议,会议约有600个与会者(Kurzhanski, 2007)。1939年在莫斯科创立了自动化与远动研究所(Anon, 1939)。该研究所成为了控制系统研究的人才摇篮,涌现了许多杰出的研究人员,其中包括A.A.Andronov ,M. A. Aizerman, A. A. Butkovsky, A. A. Feldbaum, N. N. Krasovskii, B. Ya. Kogan, A. Ya. Lerner, B. N. Petrov, V. V. Solodovnikov, Ya. Z. Tsypkin以及 S. V. Yemelyanov。该研究所还出版了一本杂志《Avtomatikai Telemechanika》,并被翻译成英文,在西方广为传阅。1944年Andronov与一群极具天赋的研究人员在自动化与远动研究所组织了一场科研讨论会(Tsypkin, 1992)。他准确预料到自动化的盛大时代(Lerner, 1974)即将来临。庞特里亚金(Pontryagin)和Gamkrelidze等来自斯特克洛夫数学研究院的数学家们也做出了像极大值原理这样卓著的贡献。在列宁格勒,斯维尔德洛夫斯克以及基辅等许多其他城市也有许多研究院。

在美国,以范内瓦•布什(Vannevar Bush)为首的包括Karl T. Compton(麻省理工学院的校长),James B. Conant(哈佛大学的校长)以及Frank Jewett(贝尔实验室的主任)在内的一众科学家向罗斯福总统请愿建立一个能利用科学技术专长的组织来支援战争 (Wildes & Lindgren, 1986, p. 182–184)。最终在1940年成立了国防研究委员会(NDRC),由布什担任主席。委员会在一年之内随即成为了科研办公室(OSRD)的一部分。据报道,布什直接从委员会的总监被提升为主席。国防研究委员会是在麻省理工学院周边的一些实验室和贝尔实验室之上建立起来的。为了精确测量速度和角速度,Charles Stark Draper在20世纪30年代创办了仪器实验室公司(Instrumentation Laboratory)(Anon, 1935; Denhard, 1992)。Harold Hazen也在20世纪30年代完成了与伺服控制相关的先驱性工作(Hazen, 1934a,b)。在1939年要求美国海军学习关于伺服控制以及火力控制的一门专业课程。课程由Gordon Brown讲授,此后他创建了伺服控制实验室 (Wildes & Lindgren, 1986, p.212–217)。国防研究委员会还在麻省理工学院成立了射电实验室(Radiation Laboratory),该实验室曾一度有约4000名研究人员,他们来自各个领域,并且有着广泛的学术和工业背景(Mindell, 2002)。来自不同团体的工程师和科学家以及工业界的工程师们在这里互动汲取养分 (Mackenzie, 1990; Mindell,2002)。

美国海军条例局资助了麻省理工学院的伺服控制实验室与仪器实验室的合作项目。Gordon Brown研制出了了改进液压系统用于转动炮塔,Draper设计了基于陀螺仪的Mark 14枪炮瞄准器。枪炮瞄准器由Sperry公司生产,到战争结束生产了超过85,000个瞄准器(Mindell, 2002)。

基于陀螺仪和加速度计的惯性导航与制导系统,是火力控制的关键技术。在Draper的Mark 14瞄准仪取得成功之后,他开始了一项紧密的计划来减少陀螺仪的漂移,进而研发惯性制导系统。到1950年,仪器实验室以及Autonetics公司都已经成功完成了基于惯性导航系统的飞行测试(Draper, Wrigley, & Hovorka, 1960; Mackenzie, 1990)。为了防止加速度计将重力加速度误认为当前的加速度,必须让加速度计跟重力方向垂直。舒勒(Schuler)证明:可以通过设计一个自然周期为84分钟的反馈回路来实现此功能(Schuler, 1923)。

仪器实验室于1970年更名为Draper实验室并在1973年成为了一家非盈利性的研究机构。伺服控制实验室依然是麻省理工学院的一部分,就是现在的信息与决策系统实验室(Mitter, 1990)。

射电实验室在二战后解散了,但是他们决定将其研究内容以28卷的系列发表出来。现引用此系列的前言:

“二战期间,我们在雷达和相关技术方面开展了大量的研发工作,不但产生了成百上千套军用雷达设备,而且带来了大量的信息和技术…由于这些基本的材料可能对科学和工程具有重大价值,在保证安全的情况下将其尽快发表出来似乎刻不容缓。麻省理工学院的射电实验室,….,承担了准备这些文卷的巨大责任。无论如何,本文描述的成果是由美国,英国,加拿大和一些其他国家在内的许多实验室、陆军、海军、大学以及工业领域中的大量从业人员共同努力的结果。在射电实验室的工作完成之后,其全体员工同意留在麻省理工学院工作六个月或更久。”

在大多数卷中讨论的都是关于雷达和微波的,但至少有两卷与控制高度相关;包括第27卷计算机理及机构,还有特别是第25卷伺服控制理论。尽管关于伺服控制有更早的书籍(Bode, 1945; Bomberger & Weber, 1941; Hall,1943; Harris, 1942; MacColl, 1945),但是此卷(James et al., 1947)无疑具有真正的里程碑意义。控制的综合学科性质体现在此卷的主要作者中,包括Purdue大学的物理教授Hubert James,泰勒仪器公司的研究室主任Nathaniel Nichols,美国南加州大学的数学教授Ralph Phillips。这本书后续部分的作者都是来自伺服控制实验室的研究人员(Brown & Campbell, 1948)。

战争爆发之前,英国在控制方面的研发是在海军研究实验室(Admiralty Research Laboratory),皇家航空研究院(Royal Aircraft Establishment,),电信科学研究院(Telecommunication Research Establishment,),国家物理实验室(National Physical Laboratory)里以及造船,化工和电力等行业中进行的(Bennett,1976; Porter, 1965)。1935年,在帝国理工学院校长Henry Tizard爵士的主持下,召开了一个研究英国防御空袭问题的委员会议。在此会议中对许多方案进行了探讨,最终决定把重点放在雷达的研发上。试验在1935年底取得成功。地面工作站到1940投入使用,机载电台也于1941年春天投入使用(Wildes & Lindgren, 1986, p. 193–194)。丘吉尔成为英国首相以后,任命Frederick Lindemann(彻韦尔子爵)教授担任他的科学顾问,Lindemann和Tizard之间经常发生争执(Clark, 1965; Snow, 1962)。那时英美之间有着广泛的思想交流与硬件交易。(Mayne, 2007; Wildes & Lindgren, 1986, p. 195)。

海军本部对于雷达在海军炮术上的应用进行了研究。研究是在Metropolitan-Vicker这样的公司中进行的,该公司拥有Arnold Tustin这样的顶尖研究人员。由于该公司在1935年就已经制造了一个机械微分分析仪,因此他们对于伺服系统和模拟计算很有经验。Tustin还主持了一批为海军工作的公司(Bissell, 1992a)。1942年由Hartee担任主席、Porter担任秘书组建了一个伺服小组(Porter,1965)。该小组的任务是交流伺服系统的经验;Tustin和Whiteley都是这个小组的成员。伺服小组后来成为了一个更正式的组织,1944年供应部组建了伺服控制及相关设备部门委员会(ICSR)。该伺服组织旨在延续这个领域的研究,为供应部出谋划策以及为所有从事政府工作的公司提供伺服控制方面的咨询。

在其他许多国家也有很多活动,诸如法国(Fossard, 2007)、意大利(Guardabassi, 2007)、日本(Kitamori et al.,1984)、中国(Chen & Daizhab, 2007)等都在控制领域有了一定的发展,甚至包括一些小国家,例如瑞典(Åström, 2007)在1945年创建了国防研究院(FOA)。

3.1 伺服控制理论的发展

早期控制研究基于线性微分方程和Routh-Hurwitz稳定性判据。而由Bode(1940)和Nyquist(1932)开发的频率响应方法成为了实现转变的典范。Bode阐述了过程控制和远程通信具有如下不同之处:

“这两个领域的特性以及其所研究的重点是完全不同的…它们的截然不同之处还体现在它们的数学风格上。典型的调速器系统本质上经常用大概不高于2~4阶的微分方程描述。另一方面,该系统总是高度非线性的,以至于就算在这样的微分方程下,对其进行分析的难度可能还是很大的…出于好奇,我曾经试着去了解,如果直接用微分方程来进行设计的话,当时正在设计的一个放大器的方程组阶数会是多少?结果证明是55。”

火控问题极具挑战性,因为这些问题涉及雷达、光学传感、预测与伺服。如2.7节所述,麻省理工学院的Hazen很早就开始进行与网络分析仪和Bush微分分析仪相关的研究(Hazen, 1934a),将该研究与Bode和奈奎斯特的观点相结合,射电实验室提炼出了分析和设计控制系统的一整套方法。许多应用是围绕伺服问题展开的,典型的例子是枪炮瞄准器和雷达。作为研究的先驱之一,麻省理工学院的Hall对其进行了如下阐述(Hall, 1956):

“真正的进步源于强烈的刺激…战争给控制工程师带来了三个难题:首先是应对需要更加准确快速的火控系统导致的相当复杂的动力学系统。第二个问题是,由于在火控系统中采用雷达而产生大量噪声,需要设计一种能够妥善处理这些噪声的系统。第三个问题来自于制导导弹,即通过微不足道的几次实地测试,精确地设计出几乎可以立刻使用的动态系统。”

伺服控制理论的关键因素包括方框图、传递函数、频率响应、模拟计算、随机过程和采样。其数学基础是线性系统、复变函数和拉普拉斯变换。

方框图是隐藏信息的抽象,在方框图中,系统用带有输入输出的方框表示。系统的内在行为隐藏在方框中。方框的行为通过微分方程或用拉普拉斯变换得到的传递函数描述。一个核心观点是,方框图中的信号之间的联系可以通过代数方程确定,而不是通过微分方程来获得,该想法源自Heaviside。方框图和传递函数使得复杂系统能够紧凑表示。一个重要的结论是:由于许多不同控制系统的方框图展示出相同的结构,因而它们的相似性变得更加显著。

对伺服控制理论的成功贡献卓著的重要因素是,系统的传递函数可以在试验中通过研究正弦输入响应来确定。利用这种方式,可以处理物理建模比较困难的系统。当时的控制工程师通过注入正弦扰动和观测响应来大胆地探寻技术系统的模型。在这里,举一个瑞典电力网络动力学的例子(Almström & Garde, 1950; Oja, 1956),一个主要的发电站的全部输出被用来干扰系统。专用的频率分析仪也被研发出来产生正弦信号和计算传递函数。

控制器设计的图形化设计方法是基于对环路传递函数频率响应的整形(环路整形)。这种设计方法产生了有理的控制器传递函数,不仅限于PID控制器。补偿器常常是超前和滞后网络的结合。非最小相位过程动力学造成的限制,在过程设计中是很明显的。由于Bode图和尼克尔斯图这种图形化表示能够提供很有效的物理图象,因此它们对于工程师们很容易使用,就像下面引用的ASEA研发部工程师所述显示的那样(Persson, 1970):

“我们通过简化模型、利用直觉、通过求解特征方程来分析稳定性的方式来设计控制器。在1950年左右,用机械计算器求解特征方程本身就是个考验。如果系统不稳定,我们就会亏损,我们不知道如何修正控制器来使系统稳定。奈奎斯特定理对于我们来说就是一场革命。通过绘制奈奎斯特曲线,我们得到了一种非常有效的方法来设计系统,因为我们知道了关键的频率范围,我们还对应该怎样修正控制器来使系统稳定获得了不错的感官体验。这样,我们就可以添加补偿器或者使用额外的传感器。”

设计方法最初只是为单输入单输出系统发展的;对不同回路,通过结合不同回路的奈奎斯特图,我们可以将这些设计方法推广到多输入多输出系统(Garde, 1948; Garde & Persson, 1960)。

干扰也是控制问题的一个关键因素;没有干扰和过程不确定性,也就没必要反馈。因此,干扰建模就十分重要。在伺服控制理论中,将干扰建模为随机过程(James et al., 1947; Solodovnikov, 1947;Tustin, 1947b)。James的书(James et al., 1947)有计算由随机过程驱动的线性系统均方误差的公式。火力控制中的一个关键问题是预测飞机的未来运动。维纳(Wiener, 1949)和柯尔莫哥洛夫(Kolmogorov, 1941)独立地给出了这个问题的解决方案。但这项研究在二战期间没有对火力控制系统产生影响(p. 280–283 Mindell, 2002)。Newton、Gould和Kaiser(Newton, Gould, & Kaiser, 1957)用维纳的预测理论来设计最小化均方误差波动的控制系统。他们方法的一个有趣特点是,他们将反馈问题转化成了等价的前馈问题,这样使问题易于求解多了。如今,我们称这种方法为Youla参数化。其他关于带有随机过程的系统控制书籍有(Davenport & Root, 1958;Laning & Battin, 1956; Solodovnikov, 1952; Wax, 1954)。

半自动地面环境(SAGE),即用于检测导弹接近北美的半自动系统,于20世纪50年代后期由林肯实验室(R & Smith,2000年)研发。该系统包括雷达网络、计算机与指挥控制中心。扫描雷达站提供了导弹位置的周期采样;于是衍生出采样数据系统中的大量研究。哥伦比亚大学的控制小组由Ragazzini所领导,该小组中的Franklin和Jury做出了显著贡献(Jury, 1958; Ragazzini & Franklin, 1958)。对采样数据系统,英国的Tustin(Tustin,1947b)和苏联自动化与远程控制学会的Tsypkin(Tsypkin,1958)也有卓有成效的研究。此前,Oldenbourg 和 Sartorius (1944)就已经对用于过程控制中的铜条系统有过研究。

因为火力和飞行控制系统涉及到回路中的人,那么自然要研究反馈回路中人的动态特征(Oppelt & Vossius, 1970; Tustin, 1947c; Blakelock, 1981, Chapter 13)。诺伯特.维纳部分受此启发,在其书中(Wiener, 1948)创造了一个术语——控制论(动物和机器中的控制和通信)。维纳强调交叉学科研究,以及控制、通信、生物和系统理论的殊途同归。Ross Ashby在其书中探究了神经系统自适应能力的来源(Ashby,1952),这与控制论的思想形成共鸣(Ashby,1956)。而钱学森的《工程控制论》(Tsien,1954)书中给出了控制论的一个工程观点,展望了1954年之后控制的很多发展。

控制论吸引专业人士和广大公众的想象力,但这个词最后还是声名狼藉了,或许是因为其缺乏任何有意义的研究结果,或是人们对其期望过高,抑或是研究太过超前。“控制论”这个单词幸存于某些机构之中。Yakubovich于1970年在列宁格勒建立了理论控制论系。挪威理工学院的控制系名为Teknisk Kybernetikk。

关于伺服控制的信息遍布于众多会议,从而促成了1956年的国际自动控制联合会的成立。1951年7月,英国科学与工业研究部在克兰菲尔德的安排了一场会议。会议记录是由Tustin编辑的,他是英国控制研究的核心人物。另一个会议由美国机械工程学会在1953年12月组织的。会议记录由Rufus Oldenburger编辑的,他是Woodward调速器公司研究部的主任,而这个会议是献给哈利.奈奎斯特的(Oldenburger,1956)。(控制系统中的最高ASME奖是Oldenburger奖。)意大利国家研究理事会在米兰组织了一系列会议,其巅峰为1956年4月拥有一千余名与会者的关于自动化问题的国际大会(Colonnetti, 1956)。

3.2 伺服控制理论的广泛适用性

虽然伺服控制理论的发展主要为了解决火力控制问题,但是越发明显的是,该理论几乎对任一控制问题都具有广泛的适用性。源于伺服控制理论涌入的思想鼓舞了更早运用控制的所有领域。开发出来处理复杂系统的相关系统工程方法论,也具有了十分广泛的适用性。

数控机床的相关先驱性工作是在麻省理工学院的伺服控制实验室进行的(Wildes & Lindgren, 1986, p. 218–225)。其在1952年展示了一台数控三轴铣床。随后为机床编程开发了第一个版本的APT(自动程控工具)语言。APT在20世纪70年代被广泛使用,而现在仍然是一个国际标准。

伺服控制理论对过程控制具有很大的影响。西门子的Oldenburger和Sartorius表示,伺服控制理论的概念和方法对于过程控制是非常有用的(Oldenbourg & Sartorius, 1944)。Smith (1944)和Eckman(1945)进行了类似的观察。用于过程控制的设备也得到了改善。虽然电子设备替代了气动设备,但是由于需要驱动力,阀门驱动还是气动的。这样使用的一个结果就是气动线路中信号传输的延迟显著降低。传感器和驱动器的线性度和精度通过使用力反馈而显著改善。反馈也被普遍用于改善电子控制器。

在20世纪50年代中期,当晶闸管可以被合理利用后,电机驱动系统显著改善。由于电力网络规模和复杂度的增加,电力系统有了重要发展。高压直流输电系统也发展起来。为了实现直流和交流的相互转换,需要精密的电子和控制系统。第一个这样的系统是1954年由瑞典内陆到哥特兰岛的一个20兆瓦100千伏的输电网络(Lamm, 1983)。

在二战期间,所需建立复杂系统的工程能力成为控制的重要组成部分。控制进展的戏剧性展示是在1947年9月,当时一架名为“Robert E. Lee”的飞机完全自主地进行了一次穿越大西洋飞行(McRuer & Graham, 1981):

“这架飞机拥有一个带有进场耦合器的Sperry A-12自动驾驶仪和一个Bendix自动油门控制系统…飞机上也有一些特殊用途的IBM设备,这些设备让飞机的自动控制命令得以存储在自动补充的穿孔卡片上。自飞机释放刹车准备从纽芬兰的斯蒂芬维尔起飞,直到次日在英国的Brize-Norton完成降落,没有人触碰过控制系统。无线电台、飞行航迹、速度、襟翼设置、起落架位置和车轮制动器的最终使用,所有这些功能的抉择,都是由存储在穿孔卡片中的程序实现的。飞机完全自主飞行似乎近在咫尺。

3.3 从机械计算机到电子计算机

1940年前开发的控制器都是基于机械、气动或电气技术的专用模拟计算机。当电子技术取代了机械技术时,就出现了突破。运算放大器的发明是该突破的关键(Lovell, 1948; Holst, 1982; Philbrick, 1948; Ragazzini, Randall, & Russell, 1947)。通过对运算放大器提供输入和反馈阻抗,有可能创造一个能够对信号做加法和积分的元件。加入乘法器和函数发生器使得开发用于实现控制系统的强大计算装置成为可能。

电子模拟计算机相比电气-机械装置有明显的优势,特别对于机载设备,重量是非常重要的。运算放大器也被用来建立通用的模拟计算机。因为他们并行工作,所以运算速度非常快。甚至可以在重复的操作中运行它们,这样参数变化的影响就可以立即可视化。可以求解的微分方程数目等于积分器的数目,一些大型装置拥有超过100个积分器。这些计算机用可拆卸的插线板进行编程。如果有代数环,即一个闭合回路没有积分器,振荡问题就会出现。

模拟计算机成为科研院所以及电气、航空航天和化工企业的流行工具。这种计算机通常由人员齐备、专注于硬件并辅助编程的计算中心运行。也有能够放在桌面上的更小的模拟计算机。一些研究机构建立了自己的系统,而且大学也得到了模拟计算机。

模拟计算机使得模拟大型系统成为可能。第一次有可能使用数学模型来探索在大范围操作条件下的系统行为。模拟计算机也能用于将实际物理器件和仿真结合的半实物仿真。模拟计算变成了一个学术课题(Howe, 1961; Lundberg, 2005)。

数字计算随着ENIAC的诞生而出现,ENIAC是在1940年中期由宾夕法尼亚大学摩尔电气工程学院的Mauchly和Eckert研发的。之后Mauchly和Eckert离开大学,成立了Univac公司。第一台计算机Univac701在1951问世。一年后,IBM宣布IBM 701研制成功。随后几家公司也进入计算机业务,但到1960年IBM完全主导了该产业。

1944年,MIT的伺服控制实验室获得了一项美国海军合同,该合同的目的是开发用于海军轰炸机训练的通用模拟器。最初该模拟器试图基于模拟计算,但是受到涌现的新技术启发,该项目转向数字计算。这台计算机依照该项目的名字命名为“旋风”(Redmond & Smith, 1980)。该项目改变了几次方向。在20世纪50年代初它被用在SAGE工程中,在这里旋风成为实时计算的早期例子。为了SAGE项目中的可行性研究,它和雷达站建立了连接。旋风被设计成一台拥有2K存储器的16位机。当进行存储器试验时,Forrester在1949年尝试了磁芯,两年后安装了磁芯存储器 (Forrester, 1951)。 Forrester和其他成员把变成标准的内存技术申请了为期20年的专利。Ken Olsen在旋风团队作为学生致力于磁芯存储器工作。后来他搬到林肯实验室制造TR-0,TR-0是旋风的晶体管化版本。在1957年,他创办了数字化设备(DEC)公司。数字化设备的PDP1计算机诞生于1959年,它是首次成功使用长字符串的小型机(Ceruzzi, 2003)。

3.4 通信

在火控系统和过程控制中,都有对控制室集中化的需求。用于火控的自整角机精度得到提升和标准化。在火控系统中用于角度通信的自整角机有了显著的进展,而且自整角机和相关设备变成了标准商品。

在过程控制中,用于通信的气动管被电气系统所取代。信号级别标准化为4-20mA。零位信号对应于非零电流的现象被用于诊断。电子系统减少了气动系统中声速限制导致的延时。带有机动设备、控制器和记录器的机柜显著发展。它们增加了用于自动开关和安全联锁的继电器板。集中控制室在过程控制中变得普遍了。

通信理论中有了开创性的突破,1948年香农发表了信息论论文(Shannon, 1948)。他定义了通信链路的“容量”,给出了研究它的适当工具,并用互信息表征它。他还研究了反馈能否用于增加容量,并给出结论:这对于离散无记忆信道是不可行的;但由于不确定延迟和有限范围限制了其对控制的影响。这些主题的讨论详见5.2节。

3.5 研究实验室和机构数量的增长

控制技术在第二次世界大战时期创建的大型实验室中得到大力支持。例如麻省理工学院周边和莫斯科市里的那些实验室。射电实验室在战后被关闭,但是一些麻省理工学院的实验室继续运行,如Draper实验室(the Draper Lab)和仪器实验室。麻省理工学院的林肯实验室于1951年成立,以开发防空系统SAGE,其中许多工程师之前就职于射电实验室。在通用电气、休斯飞机(Hughes Aircraft)、贝尔实验室、霍尼韦尔(Minneapolis Honeywell)、西屋(Westinghouse)和利德斯(Leeds and Northrup)公司里还有一些重要的控制团队。

哥伦比亚大学有一个由John Ragazzini和Lotfi Zadeh领导的强大的控制团队,其成立于1950年左右。这里毕业的学生中有像卡尔曼(Rudolf Kalman)、John Bertram、Gene Franklin、和Eliahu Jury这样的未来领袖。他们进行了采样数据系统的开创性工作;每周都有卡尔曼和Bertram主导的研讨会(Friedland,1996)。哥伦比亚的这个团队在20世纪50年代末期解散,Jury和Zadeh去了伯克利,Franklin去了斯坦福,卡尔曼去了RIAS,Bertram去了IBM。

美国兰德公司(RAND)作为智囊团成立,由道格拉斯飞机公司(Douglas Aircraft Company)运营,受美国空军资助。在20世纪50年代,他们进行了卓著的控制相关研究。George Danzig发展了线性规划(Dantzig, 1953)。贝尔曼在普林斯顿的Solomon Lefschetz指导下取得博士学位,发展了动态规划(Bellman, 1953, 1957b; Bellman, Glicksberg, & Gross, 1958)。

Solomon Lefschetz在20世纪40年代于普林斯顿建立了非线性微分方程和动力学研究中心。格伦马丁公司(Glenn Martin Company)1955年在巴尔的摩创建了RIAS(Research Institute for Advanced Study,或译作普林斯顿高等研究院),与普林斯顿团队有非常密切的关系。Lefschetz和他团队的许多成员加入了RIAS,其中包括:贝尔曼、Bhatia、Hale、卡尔曼、Kushner、LaSalle、Lee和Marcus,他们后来都对控制做出了贡献。1964年,Lefschetz和他许多同事搬到了布朗大学(Brown University)形成了Lefschetz动力系统中心(Lefschetz Center for Dynamical Systems)。Lawrence Marcus去了明尼苏达大学(University of Minnesota)创建了控制科学与动力系统研究中心(Center for Control Science and Dynamical Systems)。

在20世纪50年代末,IBM和其他计算机制造商看到了计算机应用在过程控制中的潜力。他们在位于Yorktown Heights的T.J. Watson研究中心的数学系启动了一个控制研究组,任命卡尔曼为第一任领导(Robinson, 1966)。卡尔曼不久便离职,该职位由卡尔曼在哥伦比亚时的同学John Bertram接任。该团队后来搬到了San Jose。IBM还在欧洲启动了实验室,它在斯德哥尔摩的北欧实验室(IBM Nordic Laboratory)专攻过程控制。

在英国,一些主要的研究人员进入了大学。1953年,Tustin成为了帝国理工学院电气工程系的负责人,此时Westcott已经是这里的讲师。同年,Coales去了剑桥(Bennett, 1976; Mayne, 2007; West, 1985)。英国的国家物理实验室(National Physical Laboratory)启动了一个控制研究团队。

中国有着悠久的科学传统。钱学森曾和冯.卡门(von Karman)一起在加州理工学院的喷气推进实验室研究导弹制导。1954年,他出版了名著《工程控制论》(Tsien,1954)。1955年,钱学森回到中国,讲授控制课程,并提议建立航空和导弹研究机构——国防部第五研究院(Chang, 1995)。1956年,中国科学院创立自动化研究所。1962年,数学家关肇直在中国科学院数学研究所建立控制理论研究室。1961年,经过大量准备工作之后,中国自动化学会(CAA)成立(Chen & Daizhab, 2007)。

随着控制研究在工业界和学术界的发展,它在其他许多国家也有类似的举动(Bittanti & Gevers, 2007)。布拉格与布达佩斯的科学院也创建了研究机构。斯德哥尔摩的国防研究院(Research Institute of National Defense)有一个模拟计算组,还有一个导弹制导和控制理论组。1955年,萨博公司(Saab)仿照兰德公司的模式创建了一个叫R-System的部门,这个部门由瑞典空军赞助(Åström, 2007)。

3.6 控制教育的开端

多数控制研究是在工业协会和研究学会中以及在某些大学中进行的。当伺服控制理论出现时,人们认识到伺服控制理论是一个能够广泛应用的有用技术。控制课程在几乎所有工程学校中引入。控制团队在很多公司中组建,而专攻控制的新企业也建立起来。这时写了许多教材。美国的书籍除了(Eckman, 1945; James et al., 1947; MacColl, 1945; Smith, 1944)这些,还有(Bower & Schultheiss, 1958; Brown & Campbell, 1948; Chestnut & Mayer, 1951; Thaler & Brown, 1953; Truxal, 1955)。苏联的教材包括(Aizerman, 1958; Krasovskii, 1959; Solodovnikov, 1954; Voronov, 1954)。图书也在德国(Oldenbourg & Sartorius, 1948; Oppelt, 1947; Schuler, 1956)、英国(MacMillan, 1951; Porter, 1950; West, 1953)和法国(Gille, Pelegrin, & Decaulne, 1959)出版。早期控制教材的列表连同国际自动控制联合会第50届年会材料汇编到一起(Gertler, 2006)。列表包括在1960年以及之前出版的33本书。Truxal的书(Truxal, John 1955. Automatic feedback control system synthesis.是20世纪50年代中期控制教育发展水平的代表。覆盖到的主题包括基于拉普拉斯变换的线性系统理论、根轨迹方法、随机过程、采样数据系统以及基于相平面和描述函数方法的非线性系统分析。书中总结了很多结论,并展示了一个受电路理论启发的控制器设计的系统方法(Guillemin, 1940; Van Valkenburg, 1955)。

3.7 专业控制学会的诞生

1943年美国机械工程师学会(ASME)针对仪器和调速器开设了一个分支。1946年对工业仪器感兴趣的公司成立美国仪器学会(ISA)。他们在1954年出版了一本后来称为inTech的期刊。

早期很多自动控制研究因为其军事关联性而被分门别类。战后需要更多开放交流。IRE(即现在的IEEE)在1954年建立了一个自动控制专业小组。后来成为IEEE自动控制学报(TAC)的期刊起始于1954年,由George Axelby任编辑。

那时也出现了国际活动。在1956年,欧洲至少有八个关于自动控制的全国性会议。由于杰出的领导,国际自动控制联合会(IFAC)成立,它成为了控制领域的国际化论坛(Chestnut, 1982; Kahne, 1996; Luoto, 1978)。在1956年的海德堡会议上,来自19个国家的参与者们敲定了许多组织议题,设立起三年一次的世界大会、座谈会和研讨会的组织框架。来自于通用电气研究实验室的Harold Chestnut被选举为第一任主席并决定于1960年在莫斯科举办第一次世界大会。这次会议有巨大影响,因为它为曾经一直独立工作的研究者提供了一个会见致力于相似问题的同行们的机遇。

4 黄金年代

控制在1960年之前取得的成就足以令任一领域都为之骄傲,然而更多的成就却随之而来。太空竞赛和使用数字计算机实现控制系统触发了新的进展。伺服控制理论不能很好地适用于多输入多输出系统,系统性能亟需优化,而且计算机控制提出了新的挑战。对于过程控制,基于注入正弦信号来建模很费时。这些挑战需要新的工具,而控制学家热切地转向于数学寻求新观点。许多子专业需要聚焦并深潜于应用数学。

相对于理论落后应用的前一个时代而言,这个时代的理论研究赶超了实践。许多观点都是以开环的方式来研究,没有从应用中反馈而获益。在一些情形下,计算能力还不够强大,或是网络还未出现而无法测试这些想法。这个时期,研究和教育显著增长,有富余的基金资助。取得的发展也受到计算技术进步的强烈影响。1960年的计算机运行缓慢,体型笨重,不可靠还昂贵,到2000年时却快速、小巧、可靠而便宜。

这个时期,合适的理论是基于状态空间而非频域的(Kalman,1961b)。人们发觉,俄国的李雅普诺夫(Aleksandr Lyapunov)关于微分方程稳定性(Lyapunov,1892)的早期工作对于解决用微分方程描述的系统稳定性问题很有用(Kalman&Bertram,1960)。在苏联,庞特里亚金和他的同事(Boltyanskii, Gamkrelidze, & Pontryagin,1956; Pontryagin et al., 1962)以及控制科学所(Institute of Control Sciences)的研究人员研究了基于微分方程系统的最优控制问题。他们的研究是关于变分法早期工作的推广 (Ferguson, 2004;Kalman, 1963b)。卡尔曼(Rudolf Kalman) 奠定了线性系统的基础(Kalman, 1958, 1961b, 1962, 1963a; Kalman & Bucy, 1961)。状态空间理论找到了直接的应用。Swerling (1959), 卡尔曼 (1960), 以及卡尔曼和Bucy (1961)拓展了维纳的滤波理论以便求解瞬态行为和时变系统。贝尔曼(Richard Bellman)发展了用于优化确定性和随机系统的动态规划方法,该方法包含了贝叶斯自适应控制的基础(Bellman, 1953, 1961, 1957b)。在接下来的五十年里,研究者们详尽地研究了所有成果,筑建起系统理论的宏伟大厦。研究者们探索了线性系统、最优控制、动态规划、不完全可观系统,系统辨识、自适应控制、非线性估计、鲁棒控制、非线性系统、分布参数系统、分散系统、离散事件系统等概念。有意思的是这些观点中有很多是在技术还无法实现的时候研究的。

由于安全和性能的极端要求,航空航天工业一直处于技术前沿。在1960–1980年期间,过程控制是计算机控制的强大驱动者,但到上世纪80年代汽车工业接管了这个角色。制造和排队问题也驱动了运筹学应用到控制中。

黄金年代是一个高产时期,我们的讲述绝不完整,特别是我们没有充分涵盖机电、机器人、分布参数控制(偏微分方程),哈密顿系统控制,所提及的只是诸多此类例子中的一部分。在此我们为疏漏而致歉。

4.1 太空竞赛

太空旅行和弹道导弹带来了许多挑战,其中主要是制导、控制和估计问题。如何有效地利用中小型火箭将卫星置于轨道上?如何寻找星际旅行的最优轨迹?如何使再入地球大气时产生的热量最小化?如何在发射、滑行和再入过程中控制火箭?如何根据加速度计、陀螺仪和星象确定位置、速度和朝向。

苏联的项目由Sergei Korlev所领导,由来自佩讷明德的德国工程师和科学家担任顾问。第一枚火箭R-7 Semyorka基于V2火箭并装有新型控制系统。在1957年被用于发射斯普特尼克1号卫星。四年后,加加林(Yuri Gagarin)成为了第一名宇航员,冯.布劳恩和他的几个同事共同加入了在Huntsville Alabama的陆军弹道导弹局(Army Ballistic Missile Agency)。斯普特尼克1号在美国引起了恐慌。一个新的部门——NASA在1958年创建。1961年,美国总统肯尼迪(Kennedy)宣布在未来10年内实现载人登月目标。NASA获得了大量的资助并迅速成长至8000人。许多研发任务委托给了工业部门和大学。

航空航天工业中的这些新挑战是伺服控制理论解决不了的,于是有了许多新途径的探索。各色团体集中大量资源来解决了特定的工程问题。从工程应用、数学和计算机领域涌入的观点令控制研究受益颇丰。

惯性导航使洲际导弹和太空飞行成为可能;该技术需要着力开发陀螺仪、加速度计、计算机和制导理论。由Charles Stark Draper领导的麻省理工学院仪器实验室是其中的主角,该实验室与工业机构紧密合作并在若干系统中担当了主要贡献者 (Mackenzie,1990)。

4.2 计算机控制

数字计算机的出现随之带来了将其应用于控制的猜想,“旋风”计算机(见3.3节)确实是针对该目的而设计的。今天,我们很难把握20世纪50年代时计算机的状态。我们引用卡尔曼在1958年发表的一篇描述他尝试实现一个自适应控制器的论文(1958)中的话来展示当时的情况:

“但在特定的应用中,通用数字计算机却是一件昂贵、笨重、极其复杂又有点难用的设备…因为这些原因,人们制造了小型专用计算机。”

1962年在一次员工会议上,IBM约克敦高地研究部数学部门负责人Herman Goldstine引用了下面的话,说明了对计算巨大影响的看法::

“当事物改变两个数量级时,那不叫改革,而是革命!”

结合Goldstein的说法和Moore定律,就知道自1971年后计算机每十年就会庆祝一次“革命”。这对如何设计和实现控制系统有着强烈影响。

通用计算机糟糕的计算能力和可靠性,是北极星洲际弹道导弹(Polaris ICBM)为何使用模拟计算机仿真器——数字微分分析仪(DDA) (Mindell, 2008, p. 98), (Mackenzie, 1990)的原因。这台计算机是由仪器实验室研发的。它的后继者阿波罗制导计算机(Apollo Guidance Computer)(Mindell, 2008, ch. 6)采用了带有传统计算机架构的集成电路。该计算机的第一个版本Block I,有1K字节的16位磁芯存储器和24K字节的只读存储器,时钟速率为1MHz。阿波罗制导计算机的各个版本后来用来展示飞机电传系统的可行性。截至1966年8月第一代阿波罗制导计算机Block I试飞之前,计算机用于工业过程控制已有7年。

这个时期,工业过程控制有了重大发展。即便计算机运行缓慢,体型笨重还昂贵,但它们仍能满足过程控制的基本需求。企业看到了提高生产的潜力,而计算机公司看到了商机。控制研究团体在过程工业内部形成,并联合计算机公司执行了可行性研究(Harrison, 1978)。第一个用于生产的系统是德州的Port Arthur炼油厂使用的Ramo-Wooldridge RW-300计算机。早期设备使用了监管控制,其中由计算机提供指定点给PID控制器,而PID控制器用来处理基本的控制回路。

当IBM进入这个领域时,他们使用了一台小型的半导体科研计算机——IBM 1620作为基础。这里插入一则有趣的旁白,Ted Hoff开发的首台微型计算机受到了IBM 1620的启发。IBM1720以1620为基础(Harrison, Landeck, & Clair, 1981),具有可变字长、一个硬件中断和各种模拟、数字输入输出接口。在1961年,1720的一个升级版本被称为过程控制计算机系统(Process Control Computer System)IBM1710。其典型配置为带有40K十进制(80K字节)磁芯存储器的CPU、2M十进制(4M字节)的硬盘,80路模拟输入,20路脉冲计数输入,100路数字输出和50路模拟输出。该计算机有100KHz的时钟频率。典型的设备执行多回路监督控制、生产规划、质量控制和生产监督(Ekström, 1966)。在1964年,IBM1800发布了,它是第一台为实时过程控制应用而设计的计算机。这台机器大获成功并发售了几千台(Harrison et al., 1981)。随后许多计算机公司进入这一行业。

当计算机变得更强大更可靠,就有可能让这些计算机直接控制驱动器。1962年一种称为“直接数字控制(Direct Digital Control)(DDC”的系统架构出现了,此时英格兰的帝国化学公司(Imperial Chemical Industries)(ICI)用Ferranti Argus计算机来控制纯碱厂。计算机控制用于包括底层回路的所有的控制功能。系统有224个变量的传感器和直接控制129个阀门的计算机。计算机控制使操作者面板得以简化,而且系统无需重新连线可以通过编程重新设置。

计算机化过程控制的飞速发展体现在其技术经历了专用机器、小型计算机和微型计算机几个阶段,并出现了许多驱动器。计算机公司开始从仪表公司接管的领域中退出。分布式计算是有吸引力的。在1975年,Honeywell和Yokogawa带来了分布式控制系统(DCS——TDC 2000和CENTUM。这种系统允许功能和空间分布单元上的直接数字控制。系统有用于和过程、模拟或数字信号以及人机界面交互的标准单元。几个制造商的跟进使得DCS变成了过程控制系统的标准。

基于小型和微型计算机的分布式控制系统的出现,使得计算机控制在过程工业中迅速增加。从1962年三月的159个系统增长到1970年的5000个,而到1980年数量已经多达一百万。过程工业的计算机控制变成许多不同零售商的主要业务:ABB、Emerson、Honeywell, Siemens、 Rockwell 和Yokogawa公司是出现在当时的主流供应商。

传统意义上来讲,过程控制系统有两类设备:带有控制器、记录仪和显示器的控制面板,以及用于开关时序和安全联锁的继电器柜子。当小型计算机出现时,控制面板被DCS系统所取代。同样用于制造业自动化的继电器系统有了类似的进步。通用汽车公司对于能够取代继电器的标准机器控制器的需求给了电子行业挑战。而一些公司响应了挑战。美国数字设备公司(Digital Equipment)研究的基于小型计算机的系统没有被接受。在1969年,Bedford Associates和Modicon成功演示了一个专用系统。它坚固耐用,带有传导冷却而无风扇。1971年,Allen Bradley开发出一个叫做可编程逻辑控制器(Programmable Logic Controller)(PLC)的设备。这个系统的架构是基于带有不同循环速率的轮转调度器。PLC最初是用称为梯形图(LD) 的图形化语言编程,该语言模拟了用于描述继电器电路的梯形逻辑。后来一些不同的编程风格被标准化(International Electrotechnical Commission, 2011; Lewis, 1995)为功能块图(FBD)、顺序功能图(SDC)和结构化文本(ST)。PLC发展迅速并变成自动化标准工具

过程控制系统是典型的大范围分布式系统。从传感器和驱动器引出的电线接入中心控制室并分布到计算机中,电线一般具有4-20mA的回路电流。这些系统维护和升级昂贵且困难,有几十年的寿命。上世纪70年代网络和一些不同系统的诞生自然地取代了昂贵的连线。德国和法国分别开发了各自的国家标准PROFIBUS(1986)和FIP(WorldFIP, 1982),而美国制造商在吸收FIP基础上形成了联盟基金会现场总线FOUNDATION Fieldbus(Fieldbus Foundation, 1994)。后来在零售商商业利益的驱使下观点出现了分歧(Felser, 2002)。十多年后,国际电工委员会IEC(International Electrotechnical Commission)在2000年引入了IEC61784标准,其中包含了许多不同供应商的特征,类似的标准出现在建筑业中。一些零售商则转而使用以太网。

4.3 汽车行业应用

汽车行业是控制的重要应用领域,仅在2000年就生产了4000万辆汽车,其庞大的规模成为控制技术强大的驱动力。正因为有这样大的市场,汽车工业对微控制器及集成的有模拟、数字输入输出设备的微处理器发展都做出了巨大的贡献,同样也激发了廉价的尾气排放检测器、加速度计和陀螺仪的发展。汽车工业与航空工业一道成为了基于模型设计方法的早期使用者,并且为建模、模型控制一体化及控制系统实现的研究提供了沃土(Guzzella & Sciarretta, 2013; Kiencke & Nielsen, 2005)。汽车工业在世纪之交对控制的影响已经越来越大,在21世纪将会更大。

环境问题和石油危机引发了对减少尾气排放和燃油消耗的诉求。1967年美国加州成立了清洁空气资源委员会(Clean Air Resources Board);1970年有关汽车尾气排放的诉求变成了联邦美国法律。尾气排放反馈控制让满足新法要求成为可能。该控制系统使用了新型氧传感器(lambda传感器)、催化转化器、和一个保持转化器氧含量接近于化学计量条件的反馈系统。通用汽车是该控制系统的早期使用者之一。引用通用汽车控制组组长John Cassidy的话讲:

“我想起与Ed Cole的一次会谈,他具有工程师背景,是当时的通用汽车总裁。本来使用一个基于运算放大器的相当简单的电路就可以工作的闭环系统,而Cole先生在那次会谈中却决定让通用汽车采用基于新兴微处理器技术的先进技术路线。从此,行业其它从业者跟风而上。”

20世纪70年代晚期,各种系统投入生产。基于计算机的反馈控制一经引入汽车,便迅速扩展到许多其它功能上。引入防抱死刹车系统(ABS)防止车轮锁死。电子刹车系统(EBS)和电子稳定控制(ESC)分别控制制动器以提高稳定性和转向。这些系统都使用了加速度计和陀螺仪作为传感器。虽然自动巡航控制早就已经被使用,但由计算机控制使其实现更加方便。结果便是,巡航控制如今成为一种标准配置。为了与前面汽车保持固定距离,车上引入了基于雷达传感器的自适应巡航控制。这些系统带来的出色体验激励着汽车制造商引入更复杂的系统,比如碰撞规避、辅助泊车、以及自动驾驶(Caveney, 2010)。

起初,控制系统通常是附加功能。而随着时间推移,已经出现了机械和控制一体化设计的趋向。如今,涡轮增压器的控制让更小的引擎得以使用。而混合动力和电动汽车则是系统与控制协同设计更加突出的典范。

1986年,Pravin Varaiya与Caltrans合作,于加州大学伯克利分校发起了一项雄心勃勃的研究项目——高速公路先进技术方案(Program for Advanced Technology for Highways)(PATH, 1986),该项目探索了利用电子系统联系的汽车编队。1997年,该项目演示了以60英里每小时行驶于圣地亚哥高速路上间隔21英尺的汽车编队,并证明了交通流量可以因此而被翻倍。PATH项目依旧继续致力于交通流控制方向,编队对于重型汽车极其高效(AlAlam,Gattami,Johansson,&Tomlin,2013;Liang,Martensson,Johansson,& Tomlin, 2013)。

4.4 最优控制

早期火箭推力不大,因此如何最高效地发射火箭就成为了关键问题。解决这类问题的尝试导致了最优控制理论的发展。数学家和控制专家做出了主要贡献。发源于1696年伯努利提出的最速降线问题中的古典变分学在这期间经历了一次复兴(Gelfand & Fomin, 2000)。庞特里亚金与他莫斯科的同事遵循欧拉-拉格朗日的传统发展了极大值原理(Pontryagin et al., 1962)。他们在1962年被授予列宁科技奖(Lenin Prize for Science and Technology)。而相反地在美国,贝尔曼追随哈密顿-雅可比的想法发展了动态规划(Bellman, 1957; Bellman et al., 1958)。

贝尔曼解决了特殊情况下具有二次型指标的线性系统情形(Bellman et al., 1958),而卡尔曼则提供了完整的解决方案(1960)。Athans和Falb(1966)、Byrson和何毓琦(Ho)(1969)的两本书以工程师易于理解的方式呈现了该结果,还处理了计算问题。Bryson(1966)展示了最优控制令人惊艳的力量。他计算出了飞机从海平面飞行到20km的最优航迹,发现该航迹可以在332s之内实现。该最优航迹经过了飞行测试,飞机到达20km处用了330s。而传统的准稳态分析甚至预测飞机飞不到20km。最优控制快速发展,出版了很多书籍,相关课程也引入到控制学科的课程表中(Anderson & Moore, 1971; Lee & Marcus, 1986; Lewis, 2012)。

另一种诞生于工业中的最优控制数值方法——模型预测控制如今已广泛使用(Camacho & Bordons, 2004; Clark, 1994; Maciejowski, 2002; Qin & Badgwell, 2003; Rawlings & Mayne, 2009; Richalet & O’Donnovan, 2009)。2011年的米兰国际自动控制联合会(IFAC)世界大会选拔“Constrained model predictive control: stability and optimality.”(Mayne, Rawlings, Rao, & Scokaert, 2000)授予最高影响论文奖(the first High Impact Paper Award)。

4.5 动态规划

20世纪五十年代,由美国空军支持的兰德智库公司(RAND corporation)对多级决策很感兴趣。理查德•贝尔曼迷上了这个问题。他开创了动态规划领域,并发展了最优化原理(Bellman, 1957b)。动态规划在随机系统的情形下非常有趣,因为它以状态反馈形式提供最优策略。Howard发展了策略迭代算法(Howard, 1960)(见4.14节),该算法在状态量和动作数量有限的情况下能高效地确定最优策略。该算法在运筹学和工业工程中非常流行(见4.14节)。Blackwell (1962)进一步优化了该算法。他全面地展示了在无限时间步长情况下正、负代价函数,以及折扣代价函数带来的差别(Blackwell, 1965, 1967, 1970; Strauch, 1966)。连续时间版本的动态规划方程称为最优代价函数的哈密顿雅可比贝尔曼方程(HJB方程)

然而动态规划计算很复杂,一直受困于“维数的诅咒”。如今随着高速计算机开始普及,利用非线性函数逼近代价函数的方法——比如神经网络——已经引起人们的关注。1995年,TD-Gammon——一种基于时序差分的学习机制,利用了自我训练的神经网络——达到了世界级人类玩家的水平。

动态规划对于发现最优方案的定性性质也已经变得有用。如4.14节所述,人们已经发现该方法在诸如库存控制和生产规划等领域中极其有用(Veinott, 1965; Bielecki & Kumar, 1988)。马尔可夫决策过程是一种对于有限状态随机系统的动态规划,它在运筹学研究与工业工程系课程中是标准部分。

人们已经发现动态规划具有广泛的适用性。在互联网中,用于决定图上两个节点间最短路径的分布式Bellman-Ford算法是像RIP(Hedrick, 1988; Malkin, 1988)和IGRP(2012)等基于距离矢量的路由算法中的关键部分。随着机器学习和人工智能对快速计算方法的兴趣日益增长,使用动态规划思想正变得广泛。

4.6 动态博弈

冯.诺依曼是博弈论的先驱,他试图以此建立经济行为的基础(von Neumann & Morgenstern, 1947)。他分析了一方代价是另一方代价相反数的静态二人零和博弈,以及具有各方都追求最小化同样代价判据的静态团队问题。对于各方只有有限数量选择的二人零和“矩阵博弈”,他证明了在随机化的策略中存在一个鞍点(von Neumann, 1928)。随后,纳什(1951)对于非静态零和博弈证明了一个相似的结果。

与贝尔曼在兰德智库发展动态规划的同时,Rufus Isaacs正在研究动态连续时间二人零和博弈。“Isaacs方程”是一个双方版本的哈密顿-雅可比方程(Isaacs, 1975)。该微分对策理论被用在如“斗狗”和“坦克大战”等军事问题中(Ho, Bryson, & Baron, 1965; Zachrisson, 1964),之后被用于鲁棒控制(Başar & Bernhard, 1991)。

Shapley (1953) 和 Everett (1957) 几乎同时研究了离散时间的博弈。Zachrisson (1964)对于Markov对策提供了一个特别令人信服的解决方案。对于纳什平衡点、Pareto最优性、Stackberg解和动态博弈内在驱动力的研究兴趣随后又持续了几十年(Başar & Olsder, 1982; Ho, Luh, & Muralidharan, 1981; Simaan & Cruz, 1973; Starr & Ho, 1969)。

4.7 线性系统

线性近似方法在控制系统的分析和设计上极其有用。在早期的发展中主要使用微分方程,但当引入伺服控制理论时趋势却转向了频率响应。由于频率响应不适合数值计算且不便于处理多输入多输出系统,20世纪60年代又出现了微分方程的回归。微分方程的回归变成了广为人知的“状态空间法”,因为牛顿的状态概念扮演了核心角色。它也被称作“现代控制理论”以区别伺服控制理论。线性系统研究中加入的精巧数学最终造就了更多的教材。Zadeh和Desoer (1963),Brockett (1970)和Kailath (1980)的教材都很流行。

模型的重新设定自然而然地提出了两个问题:能否通过选择合适的控制信号到达所有的状态;是否能够通过测量输出重建状态。卡尔曼摆出了这些问题并且定义了能达性和能观性(Gilbert, 1963; Kalman, 1961b, 1963a; Kalman, Ho, & Narendra, 1963)。卡尔曼的结果对于线性微分方程和相关传递函数的关系也提供了清晰图景,还扫清了关于传递函数中零极点对消效果的疑问。

经典背景下关于线性反馈系统结构的研究也出现了。Horowitz(1963)引入了一个控制器架构,它有两个自由度,结合了反馈和前馈,从而使指令信号跟随的需求可以从鲁棒性和扰动衰减的需求中分离出来。伺服控制也在状态空间模型中进行了分析 (Davison, 1976)。

线性系统理论严重依赖于线性代数、矩阵理论和多项式矩阵。数值线性代数的结果也可以用于计算(Laub, Patel,&VanDooren,1994)。当关于状态空间理论的章节加入到经典的伺服控制资料中时,教材的篇幅增加到了700页甚至更多(Dorf, 1980; Franklin, Powell, & Emami-Naeini,1986; Kuo, 1962; Ogata, 1970)。

在标准的状态空间理论中,状态空间是欧氏空间且时间是实变量。卡尔曼、Falb和Arbid (1969) 将其推广到环上系统。线性系统,有限状态机和自动机的统一框架得以建立。Lee 和 Varaiya (2003)所著信号与系统导论的书秉承了这一精神。Ramadge 和 Murray Wonham (1987)开创了离散事件系统理论,用以解决自动机和形式化语言模型的能控性、能观性、聚合、分解和分层控制的控制理论概念(Boel & Stremersch, 2012; Ramadge & Wonham, 1989; Seatzu,Silva, & van Schuppen, 2012)。近来,学界对连续和离散行为组合的混合系统(Brockett,1993; Goebel, Sanfelice, & Teel, 2012; Maler, 2010)产生了显著的兴趣。

奇异摄动理论(Kokotovic, Khalil, & O’Reilly, 1986)和广义线性系统(Duan, 2010被用于解决大跨度的不同时间尺度系统。微分代数系统被用于大型电路建模(Gear, 1971)。受电路理论的启发,Willems (Polderman& Willems, 1990)提出了行为系统的系统模型,它削弱了输入输出的影响,同时也被描述为微分代数系统。微分代数方程是模拟物理系统的天然框架,也是建模语言Modelica(Tiller, 2001)的数学框架。关于无穷维动力系统有大量的文献(Banks, Fabiano, & Ito, 1993; Bensoussan, Da Prato, Delfour,& Mit-ter, 1992; Curtain & Zwart, 1991; Lions, 1971),流体的流动控制是其中一个应用领域(Aamo & Krstić, 2002)。

虽然从研究的角度人们已多次宣称线性系统领域已然成熟,但是由于新观点和新理论的引入,研究的兴趣却在反复更新。

4.8 状态反馈卡尔曼滤波与 LQG

在用状态空间理论进行设计时,会很自然地使用状态反馈,因为状态中包含了所有过去的信息。线性控制器可以表示为一个矩阵,将状态变量映射到控制变量。卡尔曼将状态模型的设计问题表述成一个优化问题,其中最小化判据是状态和控制变量的二次型,即所谓的LQ问题。他优雅地解决了这个问题,并且证明了最优反馈是由一个Riccati方程解给出的。引用卡尔曼的原文:

人们可以将物理实现问题分为两个阶段::

(A) 根据t<t1的量测信息y(s)(输出)计算状态x(t1)的最优近似Xt1

(B) 由控制量u(t1)计算出x(t1)。

令人惊讶的是,问题(A)的理论中包含了维纳滤波和时间序列预测作为其中的一个特例,结果证明问题(A)的理论与本文研究的问题(B)理论相类似。该结论来源于作者发现的对偶理论。

卡尔曼的解同样适用于线性时变系统。相应的差分方程问题也非常相似,这引起了采样系统理论的变革。有解的条件是系统能达。解的一个重要特性是使闭环后的系统具有无穷的幅值裕度、和 60°的相角裕度。他将这些关于LQ控制器的鲁棒性结论拓展到非线性系统;并做了进一步推广。

卡尔曼还证明,具有高斯噪声的线性系统最优滤波器是由测量到的观测结果所驱动的过程模型,增益由Riccati方程指定。可解性条件是系统能观。包含状态反馈和卡尔曼滤波器的控制器,即著名的LQG控制器,其最优性被经济学家Simon在一个特例中首先证明。关于分离的一些微妙之处只是最近才被整理出来。

利用伺服控制理论得到的控制器可以看作是为回路传递函数的频率响应整形的补偿器。LQG 控制器却有截然不同的解读。它有两个组成部分,状态反馈和卡尔曼滤波/观测器。控制器的动态部分来自于观测器,该观测器是过程及其环境的动态模型。该想法被Francis和 Wonham提出的内模原理捕捉到。 可以在 LQG 控制器中添加参考信号发生器,这样可以利用两自由度结构提供命令信号跟随。 LQG 控制器非常适合多输入多输出系统。设计所需的计算是基于源自数值线性代数的可靠算法。LQG 控制器不会自动提供积分作用,这说明了在设定优化问题时全面描述的重要性。积分作用可以通过扰动模型增广到过程模型来提供。

由于解的显式形式,LQG的范式已被证明是线性控制系统迭代设计的有用工具,同时也是对无限时域情况完善的渐近理论。它已经成为控制系统设计的标准工具

Witsenhausen 研究了决策者在系统中可以获得什么信息的重要问题。他证明,即使在有二次代价函数的线性高斯系统中,如果没有记忆前一阶段所做的观测,那么线性控制律就不是最优的。他证明了若干复杂性,当必须做出决策时,这些复杂性的产生依赖于可得到的分布式系统中智能体的信息。何毓琦等人进一步研究了各种易于求解的信息结构。

4.9 非线性系统

尽管大多数实际系统是非线性的,但是线性理论有些惊人的特性对于控制系统分析和综合极其有用。在古典控制理论中,考虑非线性效应的必要性是众所周知的;引用Truxal(1955, p. viii)的话:

第五,设计师必须熟悉用来分析非线性系统的基本技术。设计师必须能够分析系统中不想要的非线性效应,并将非线性综合到系统中以提高动态性能。

他提到的典型非线性有摩擦、间隙、饱和滞后(Atherton, 1975; Graham&McRuer, 1961; Oldenburger, 1956)。非线性分析的近似法由非线性动力学的相关研究发展而来(Andronov et al., 1937; Krylov &Bogoliubov, 1937; Minorsky, 1962)。谐波平衡是探索极限环的一种方法,包括研究一次谐波的传播,类似于线性系统的奈奎斯特分析方法。这个方法的一个版本被称为描述函数法(Kochenburger, 1959; Tustin, 1947a)。开关控制在控制早期比较流行,因为可以用简单的设备获得高增益;重要的理论也被开发出来(Flügge-Lotz, 1968; Tsypkin, 1949,1958, 1984)。

李雅普诺夫稳定性理论在苏联被广泛使用(Malkin, 1951)。该理论由卡尔曼和Bertram得到普及,他们借鉴了普林斯顿Lefschetz的想法,于是因此激励了西方大量相关研究工作。Krasovskii(1963)和LaSalle(1960)提供了一些有用的扩展。Willems表明,能量和耗散的概念与李雅普诺夫理论密切相关,并且发展了一套针对于耗散系统的理论(Willems, 1972)。李雅普诺夫理论现在广泛用于分析和设计(Freeman & Kokotovic, 2008)。Sontag和Wang (1995)引入的控制李雅普诺夫函数与输入-状态的稳定性概念被证明是有用的。Khalil的书(Khalil, 1992)是该领域一本受欢迎的标准教材。

无记忆非线性和线性系统反馈串接成的系统稳定性问题由Lurie和Postnikov (1944)提出。Aizerman猜想,如果非线性是扇区有界的,且线性系统对于扇区中的任何线性增益是稳定的,则闭环系统将是稳定的 (Aizerman,1949)。虽然这个猜想是错误的,但却刺激了很多创造性的研究。最初问题是由李雅普诺夫理论解决的,但重要的突破却是由Popov做出的,他用对线性部分奈奎斯特曲线的约束给出了稳定性条件(Popov, 1973a,b)。Yakubovich(Yakubovic,1964)证明, Popov的结论可以表达和扩展成线性矩阵不等式(LMI)形式。

然而Sandberg(1964)和Zames(1964)在1964年的国家电子会议(National Electronics Conference)上展示了另一种稳定性。他们的报告后来予以详细出版(Sandberg, 1964, 1965; Zames, 1966a,b)。Zames专注于输入输出特性而避开了状态空间的概念。他从麻省理工学院的Singer那里借鉴了泛函分析,并引入了小增益定理和无源性定理。这些理论推广了线性系统中增益和相位的概念。这些想法得到了很多关注,并迅速成为控制理论核心的一部分(Desoer & Vidyasagar,1975; Vidyasagar, 1978)。

20世纪70年代由于微分几何(Boothby,1975)思想的涌入,导致了几何控制理论的发展。Brockett,Jurdjevic,Hermann,Krener,Lobry和Sussman是推动该研究进程的关键研究人员。他们研究了控制中仿射非线性系统的能控性和能观性概念(Brockett, 1972, 1976; Haynes & Hermes, 1970; Hermann & Krener, 1977; Hermann, 1963; Krener, 1974; Lobry, 1970, 1974; Sussman & Jurdjevic, 1972);其判据基于李代数。反馈线性化作为非线性系统设计的一种技术引入(Hunt, Su, & Meyer, 1983)。Fliess使用微分代数来定义微分平坦的概念,后者变成了前馈和跟踪设计的有力方法(Fliess, Lévine, Martin, & Rouchon, 1975, 1992; Fliess, Lévine, Ollivier, & Rouchon, 1995)。计算机代数用来计算李括号。Isidori和Byrnes引入了零动态的概念,推广了线性系统的零点(Isidori&Byrnes, 1990)。几何控制理论有很多有趣的应用,如航天器姿态控制(Sidi,1997)、飞机大攻角飞行(Stengel&Robert,2004,第7.4节)、拖车倒车(Fliess,Lévine和Martin ,1993)、步行机器人(Westervelt,Grizzle,Chevallereau,Choi,&Morris,2007)和量子系统(Huang, Tarn&Clark, 1983; Khaneja, Brockett, &Glaser, 2001)。几何控制理论是一些书中非线性控制理论的核心部分(Isidori, 1995; Nijmeijer & van der Schaft,1990)。

4.10 随机系统

即便系统观测中带有噪声,若考虑将状态的条件概率分布作为“超状态”,同样可以使用动态规划(Åström,1965)。 Striebel (1965)对分离策略的最优性进行了深入研究。

对于线性高斯系统,根据分离定理,由于条件概率服从高斯分布,超状态为有限维,于是可用条件均值和条件协方差完全描述。如4.8节所述,如果代价函数进一步取为状态和控制的二次型函数,那么就可以得到确定性等价分离定理 (Joseph & Tou, 1961; Potter, 1964; Simon, 1956; Theil, 1959; Georgiou & Lindquist, 2012)。由代价的二次型指数形式期望值组成的代价函数也可以显式求解,因为它是乘性可分解(multiplicatively decomposable)的(Jacobson,1973)。这样的代价函数可用于风险规避或风险追求行为的建模,与微分对策和鲁棒控制也有联系。

贝尔曼还阐述了这样一个事实,当参数未知时,如果将未知参数的条件分布视为超状态,动态规划可用于开发系统的自适应控制器(Bellman, 1961)。在此情形下,控制有两个目的,既是激励系统并决定系统特性的工具,也是移动系统状态到目标区域的工具。Feldbaum称之为“双重控制” (Fel’dbaum, 1961)。

从概念上讲,使用动态规划来设定和解决自适应控制问题是非常有吸引力的。然而,庞大的状态空间带来显著的计算问题——维度灾难。因此,人们去追求一种非贝叶斯确定性等价的替代方法,继而形成了自整定方法;参见4.12节。一种早期尝试的贝叶斯方法是用一个二次型函数局部逼近损失函数 (Mayne & Jacobson, 1970);另一种途径是用蒙特卡洛方法来估计未来代价(Bertsekas & Tsitsiklis, 1996)。

一个特殊的自适应控制问题是多臂赌机问题,该问题抓住了控制的双重角色所体现的权衡精髓。自适应控制问题化身为一种更有用的版本,它模拟了对疗效未知的药物进行测试的问题。在赌机的版本中,以若干回报概率未知的赌机作比方,概率被建模为具有先验概率分布的随机变量。一个沉迷于老虎机的赌徒每天必须玩一个摇臂,目标是通过玩摇臂获得最大的总回报。这个问题很特别,如果一个摇臂哪天没玩,就对这个摇臂的回报一无所知;因此,它的超状态没有改变。对于回报打折的情形, Gittins和Jones (1974)证明该著名问题具有引人入胜的结构。每个摇臂都有一个由其超状态定义的指标,最佳策略就是玩有最高指标的摇臂。一个摇臂的指标是打折后的最大期望回报。

随着强大计算能力的出现,“部分观测的马尔可夫决策过程”问题 (POMDPs) (Smallwood & Sondik, 1973)作为一种在机器学习和人工智能中建模与求解问题的方法论获得了高度关注 (Geffner & Bonet, 1998; Nair,Tambe, Yokoo, Pynadath, & Marsella, 2003; Ng & Jordan, 2000; Pineau, Gordon, & Thrun, 2003; Shani, Pineau, & Kaplow, 2013; Spaan & Vlassis, 2005; Thrun, 2000)。

从二十世纪五十年代末期开始,非线性系统的最优滤波器研究引起人们极大的兴趣。对于离散时间情形,给定过去噪声的测量,获取系统状态的条件分布可简单归结为贝叶斯规则的一个应用。考虑贝叶斯规则中忽略分母的非归一化分布,可以获得条件分布的线性递推方程 (Kumar & Varaiya, 1986)。在非线性随机微分方程代表的连续时间情形中,其最优滤波方程也是非线性的 (Fujisaki, Kallianpur, & Kunita, 1972; Kushner, 1964, 1967; Stratonovich, 1959)。然而,通过非归一化概率分布的传播,最终得到的方程是线性的(Duncan, 1967, 1969; Mortensen, 1966; Zakai,1969)。其核心困难是,除了特殊情况外,滤波器一般不是有限维的。就像动态规划中的情形一样,随着可用的计算机越来越快,人们可以明智的利用这种计算能力进行仿真来接近未知分布;该分支的一个例子是用于非线性非高斯分布系统的粒子滤波器 (Gordon, Salmond, & Smith, 1993; Handschin & Mayne, 1969)。

早在二十世纪六十年代,研究者就已经出现了探索连续时间系统随机控制理论的兴趣 (Fleming,1963; Florentin, 1961)。在二十世纪六、七十年代,人们为发展非线性随机连续系统最优控制理论做出了巨大努力,这些系统用部分观测系统的随机微分方程描述。正如Mitter(1996)所指出的,这些成果主要在数理金融学中找到了应用 (Merton&Samuelson, 1990)。该领域有着艰深的数学挑战,几个控制研究者钻研进来,并将前沿数学研究引入随机微分方程和鞅论中。有关随机微分方程解的性质,最优解的存在性,部分(有噪声干扰)观测情况下最优解的表示等问题得到了研究(Beneš, 1971; Clark, 1978; Davis, 1980; Duncan & Varaiya, 1971,1975; Fleming & Pardoux, 1982; Florentin, 1962)。Borkar(1989)对此作了很好的记录。哈密顿雅可比贝尔曼方程解的存在性问题通过粘性方法得以处理 (Crandall & Lions, 1983; Lions, 1983a,b, 1989)。

最初受到生物学问题的启发,Snyder(1972)发展了一种用于计数过程的滤波理论。有意思的是,他在给定“滴答”测量的情况下估计过程的基本强度。该问题刺激了随机过程中大量的数学工作(Boel, Varaiya, &Wong, 1975; Bremaud, 1972; Van Schuppen, 1977),并在排队系统中找到了用武之地 (Brémaud, 1981)。一个例子是用于分析排队网络中的客户流量(Walrand & Varaiya, 1981)。点过程的随机控制也得到了研究 (Boel & Varaiya, 1977)。

4.11 辨识

促成伺服控制理论成功的一个因素是,过程的传递函数可以结合经验通过频率响应获得。然而频率响应不适合于过程控制,因为这些过程通常很慢,需要很长的时间来进行实验。除此之外,能捕捉噪声特性的模型也是需要的,比如应用LQG控制器的时候。

对于计算机控制,使用离散时间模型是很自然的。辨识的很多灵感来自于时间序列分析,在时间序列分析中,Box和Jenkins(1970)发展了从时间序列中估计参数的方法。流行的模型主要有三类,分别是自回归(AR)、滑动平均(MA)以及自回归滑动平均 (ARMA) 模型。这些模型是由离散时间白噪声驱动的差分方程。这些模型没有输入,对于控制应用来讲,有必要通过添加控制输入来扩展模型。输入的加入也引发了寻找输入信号的有趣问题,而这些输入信号提供的激励要足够丰富。通过结合概率论,统计学和时间序列分析的思想,就有可能获得具有良好统计特性的强大方法。早期应用于确定造纸机的动力学并设计控制律以最小化品质变量的波动 (Åström, 1967; Åström & Bohlin, 1965)。这个领域的研究——后来被称作系统辨识——始于二十世纪六十年代。它把控制工程师,概率论学家,统计学家和计量经济学家汇集在一起。有趣的典型的问题不只是如一致性和效率等统计问题,还有受控制启发的问题,如输入选择、开环和闭环实验等 (Gevers, 1993)。一些著作反映了研究的进展(Kumar & Varaiya, 1986; Ljung, 1987; Norton, 1986; Söderström & Stoica, 1989)。由Ljung开发的Matlab工具箱导致了系统辨识技术在工业和学术界的广泛应用。始于1967年布拉格的IFAC系统辨识系列研讨会仍在继续。

4.12 自适应控制

自适应控制出现在20世纪50年代的飞机和过程控制中(Foxboro,1950年;Gregory,1959年;Kalman,1958年)。超音速飞行和弹道导弹的产生带来了新的挑战,因为飞行器的动力学行为随高度和马赫数的变化而剧烈变化。基于恒定增益与线性反馈的自驾仪可在一个飞行条件下工作良好,但是不适用于整个飞行包线。人们提出了许多种自适应飞行控制系统并进行了飞机实验(Gregory,1959年;Mishkin&布劳恩,1961)。20世纪60年代末人们对自适应飞行控制的兴趣逐渐减弱,一个原因是以带自适应控制器的x15为发动机的火箭出现事故(Dydek、Annaswamy和Lavretsky,2010)。另一个是基于空中数据传感器的增益调度技术的成功(Stein,1980年)。

20世纪50年代和60年代初的研究促进了对贝叶斯自适应控制的概念理解,如第4.10节所述,二十世纪五十年代和六十年代初期的研究有助于对贝叶斯自适应控制的概念性理解。然而,正如那节所述,由于其复杂性,对非贝叶斯确定性等价替代方法的寻求产生了自整定方法。Draper和 Li 研究了飞机引擎的在线优化问题,并开发了一个自优化控制器,它可以将系统推向最佳运行状态,该系统成功试飞(Blackman,1962;Draper&Li,1966)的同时也开启了极值控制领域。Tsypkin表示学习和适应的计划可以在公共框架中获得(Tsypkin, 1971)。

在20世纪70年代,人们对自适应控制的兴趣重新抬头。出现了一项名为模型参考自适应控制(MRAC)的重要研究(Whitaker, Yamron&Kezer, 1958)。MRAC自动调整控制器的参数,达到对命令的响应信号接近于参考模型给出的信号。最初的基于梯度方案的MRAC被称为MIT准则,它利用李雅普诺夫理论导出具有保证稳定性的适应律,从而改进了规则,利用增广误差引入了算法的变化(Monopoli, 1974; Morse, 1980)。MRAC通过反步法扩展到非线性系统(Krsti, Kanellakopoulos & Kokotovi, 1993);Lyapunov稳定性和被动性是开发控制律的基本准则。

在过程控制中使用自适应的一个动机是,在真实的工厂上进行系统辨识实验既繁琐又耗时,而且还需要熟练的人员。因此,研究是否可以使用自适应控制器是很有吸引力的。自校正调节器(STR)估计过程参数,并找出使某一指标最小化的控制器参数,例如过程输出的方差。稳态调节是一个典型的ARMAX过程问题(自回归滑动平均模型)。这种模型的参数估计是一个复杂的非线性问题。strm和Wittenmark(1973)的一个令人惊讶的结果表明,基于最小二乘估计和最小方差控制的设计可以收敛到所需的控制器。这一点在工业应用得到了证实,随后出现了许多应用:船舶操纵的自动驾驶仪、轧钢机、连铸机、蒸馏塔、化学反应器、蒸馏塔和矿石破碎机,并提出了很多公式与理论用来应对噪声系统所需要的不同控制目标。

自整定调节器带来了大量的理论工作。系统的非线性和随机性使问题变得复杂。在对递归算法的分析中也出现了类似的问题,如ARMAX系统的随机逼近和递归识别;先前的工作为随机自适应控制系统的分析铺平了道路(Chen & Guo, 1986; Kushner & Yin, 2003; Kushner & Clark, 1978;Lai & Wei, 1982; Ljung, 1977; Solo, 1979)。稳定性、收敛性、自优化和自调整的证明花了几年时间(Becker, Kumar & Wei, 1985;Goodwin, Ramadge & Caines, 1980, 1981; Guo & Chen, 1991)。人们还研究了mras和str之间的相似性(egardt, 1979)。

早期,Egardt(1979)已经表明,即使是很小的有界扰动也会导致自适应控制器失去稳定性。ioannou和kokotovic分析了未建模高频动力学和有界干扰对自适应控制方案的影响(ioannou和kokotovic,1984)。Rohrs对未建模动力学鲁棒性的研究(Rohrs、Valavani、Athans和Stein,1985年)引起了许多对改进算法的深入研究。稳定性证明需要有界估计。人们证明信号的标准化(Praly, 1983, 1984)可以保证稳定性。稳定性也可以通过单独预测来实现(Ydstie, 1989; Naik, Kumar & Ydstie, 1992)。

自适应控制被扩展到反馈线性化非线性系统(Kanellakopoulos, Kokotovic & Morse, 1991)。它还扩展到包括应用中常见类型的非线性,如死区、反冲和滞后(Tao & Kokotovic, 1996)。自适应控制设计方法(如反步法)成为非线性控制系统设计的一个组成部分(Krstic, Kanellakopoulos & Kokotovic, 1995)。从这些工作中获得的自适应控制知识的增加在书中有很好的记录(Anderson, 1986;Str_M & Wittenmark, 1995;Egardt, 1979; Goodwin & Sin, 1984; Ioannou & Sun, 1995; Kumar & Varaiya, 1986; Narendra & Annaswamy, 1989; Sastry & Bodson, 1989)。自适应算法的变化仍然出现。L1自适应控制器就是一个例子,它继承了str和mrac的特性。Fliess的无模型控制器(Fliess & Join, 2013)是另一个与自调整调节器相关的例子。

产品使用mrac和str根据需要调整控制器,生成增益计划并进行持续调整。有些系统已经运行了30多年,例如船舶转向和轧钢机。PID控制器的自动整定被广泛应用,几乎所有新的单回路控制器都有某种形式的自动整定。自动调整还用于半自动构建增益计划。

自适应滤波与自适应控制有很强的相似性。Gabor致力于自适应滤波(Gabor, Wilby & Woodcock, 1959),Widrow开发了用于自适应控制的模拟神经网络(Adaline)(Widrow & Yovits,1962;Widrow & Stearns, 1985)。适应机制受到生物系统中赫比学习的启发。噪声消除和自适应均衡是当今消费电子产品中广泛应用的自适应技术。

人们对航空航天工业中的自适应控制(飞机和导弹)重新产生了兴趣。使用MRAC(Lavretsky & Wise, 2013)和L1自适应控制器(Hovakimyan & Cao, 2010)的飞行试验均取得了良好的结果。在未来,自适应控制可能是新兴自治系统的重要组成部分。

4.13 鲁棒控制

Bode设计了对放大器增益的变化具有鲁棒性的反馈系统。他证明:为了获得一个鲁棒放大器,开环增益必须比闭环增益大得多。因此,需要以降低增益为代价获得鲁棒性。 Horowitz师从Bode的学生Guillemin,他扩展了这一观点,并在一般反馈系统中引入了反馈成本(cost of feedback)的概念(Horowitz, 1963)。Horowitz还将Bode的鲁棒设计技术推广到更一般的过程变化。这种方法被称为qft(定量反馈理论)(Horowitz, 1993, 1991)。它基于使用奈奎斯特或尼科尔斯图的图形构造。

在状态空间框架中,鲁棒控制有了显著的发展,其优势在于引入了非常适合数值计算的技术。如第4.8节所述,具有状态反馈的LQ控制器具有惊人的鲁棒性。在20世纪70年代,大量的研究致力于探索鲁棒性是否可以扩展到使用输出反馈的LQG控制器。可解性所需的唯一条件是系统是能达和能观的。接受过伺服控制理论教育的研究人员不理解非最小相位动力学施加的经典限制为何没有出现(Horowitz & Shaked, 1975; Rosenbrock & Morran, 1971)。在麻省理工学院电子系统实验室和霍尼韦尔做了很多工作。Safonov(Safonov & Fan, 1997; Safonov, 2012)给出了一个有见地的总结。其核心观点是,鲁棒性度量应该基于开环传递函数的奇异值,而不是基于特征值。主要结果是,LQG控制器不具有鲁棒性。Doyle在题为“Guaranteed Margins for LQG Regulators”(Doyle,1978)的论文中给出了一个简单的反例,并且带有一些挑衅意味的摘要“没有”。曾多次尝试对LQG控制设计施加约束,但实际的解决方案稍后将来自不同的方向。

1981年Zams发表了一篇论文(ZAMES, 1981),为H无穷控制奠定了基础。根据Bode的想法,他考虑了输入-输出描述,并设计了控制器,使右半平面零点系统灵敏度函数的H∞范数最小化。Zames用函数分析和插值理论来解决这个问题。Zames的著作有很多的追随者,有许多扩展和概括。所谓的四块问题,包括解决四个敏感函数使其成为标准公式。这篇文章(Doyle, Glover, Khargonekar & Francis, 1989)是一个重要的进展,因为它表明H∞问题可以用状态空间方法解决,反馈和观测器增益由Riccati方程给出。所获得的控制器与LQG控制器具有相同的结构,但具有不同的滤波器和反馈增益。McFarlane和Glover将经典开环整形方法推广到多变量系统,并证明了与H∞控制的关系(McFarlane & Glover, 1992)。H∞控制开发成一种标准设计方法,包括书籍(Doyle, Francis & Tannebaum, 1992;Green, Limeber & David, 1995; Kimura, 1997; Skogestad & Postlethwaite, 1996;Zhou & Doyle, 1997年; Zhou, Doyle & Glover, 1996年)和Matlab工具箱。

H∞控制的副作用是对基本限制条件的重新关注(Seron, Braslavsky & Goodwin, 1997; Skogestad & Postlethwaite, 1996)。结果表明,当带宽太大时,右半平面零点和时滞系统不能得到很好的控制,右半平面极点系统的鲁棒控制需要很高的带宽,当极点和零点太近时,右半平面极点和零点系统不能得到很好的控制。在Keel和Bhattacharyya(1997)中给出了一个显著例子,它阐明了研究任何设计的最终结果在多大程度上是脆弱的需要和重要性。

Zames还研究了寻找适合比较系统的规范的问题。对于稳定系统来说,问题很简单;只需比较给定输入的输出。对于不稳定的系统,他引入了间隙度量(gap metric)(el Sakkary & Zames, 1980),该度量只允许提供有界输出的输入。Vidyasagar提供了另一种图形度量(Vidyasagar, 1985)。Georgiou和Smith证明了间隙度量中的鲁棒优化等价于规范化互质因子扰动的鲁棒优化(Georgiou & Smith, 1990);他们还获得了非线性系统的结果(Georgiou & Smith, 1999)。Vinnicombe引入了适用于鲁棒稳定的v-间隙度量(Vinnicombe, 2001)。

Doyle及其同事介绍了结构化奇异值(mu分析),以证明通过优化频率权重可以大幅降低增益参数的保守性(Doyle & Packard, 1993)。他们有效地利用这一点来分析具有参数不确定性和不确定线性动力学的系统。这项工作是凸优化在控制中的开创性应用,它被扩展到非线性元件

在Megretski和Rantzer(1997)关于积分二次型约束的研究中,对20世纪60年代和70年代的扎姆斯、雅库波维奇和威勒姆的方法进行了概括,并将它们与MU分析和半定规划结合起来。

当基于内点法的高效计算程序开发出来时,线性矩阵不等式成为一种有用的设计工具(Nesterov & Nemirovskii, 1994)。许多设计问题都可以通过凸优化和LMI来解决,如Boyd和其他人所示(Boyd, El Ghaoui, Feron & Balakrishnan, 1994; Calafiore & Campi, 2006; Gahinet & Apakarian, 1994; Kao, Megretski, J_nsson & Rantzer, 2004;Megretski, J_nsson, Kao & Rantzer, 2010; Packard, 1994; Scherer, Gahinet & Chilli, 1997)。

Baar和Bernhard(1991)将鲁棒控制问题定义为一个博弈问题。控制器的任务是提供良好的性能,即使对手试图以最坏的方式干扰系统。结果表明,对于线性系统,最优控制器是H∞控制器。

4.14 运筹学中的控制:库存、制造和排队系统

控制广泛用于处理运筹学中出现的动态系统问题中。许多实际应用都可以通过建模成为一个问题,它涉及到考虑折扣成本或长期平均成本准则条件下(统称为马尔可夫决策过程)无限范围内马尔可夫链的控制。解决这一问题的一种方法是“价值迭代法”,该方法将无限期最优成本确定为有限期成本的极限(Bellman,1957a)。

在20世纪50年代后期,当面临基于以前购买历史利润来优化应该给哪些客户邮寄Sears目录的问题时,Howard(1960)开发了基于有限状态和控制集的有限时间收敛的策略迭代方法(Howard,2002):

“这一切都发生在计算机仍然有真空管的时代,所以运行相当耗时。…最优的政策是平衡的…返回并影响将来的状态转换。预计目录业务的盈利能力将只增长百分之几,然而每年的盈利能力将达到数百万美元。”

动态规划在库存问题中非常有用。Scarf(1960)的一个著名成果,概括了Arrow, Harris, 和 Marschak(1951)的成果。它分析了一个一般模型,其中一个订单的成本与订购的单位数量密切相关,并且当库存和短缺都存在损耗时。他们表明,如果需求是随机的,并且在完成订单方面存在滞后,那么最优策略是(s,s)-类型:如果库存水平小于s,那么订单将达到库存水平s。这种类型的结果的扩展目前仍然是一个活跃的运筹学领域(Wu & Chao, 2013)。

最新的研究兴趣之一是通过网络对物料流进行供应链管理,将来自上游供应商的订单和交付给下游客户(可能还涉及装配)的多个自主体耦合起来,以最大限度地降低库存成本或短缺成本;最近的回顾见Wang(2011)。有趣的是,这个领域的早期研究者是Forrester(见第3.3节),他搬到了麻省理工斯隆管理学院,并于1956年开始了系统动力学的研究项目。他的书《工业动力学》(Forrester, 1961)探讨了通过批发商从制造商到消费者的商品链存储动态。他开发了模拟器stella(Forrester, 1961; Richmond, 1985),现在仍然可以使用(Forrester, 1961; Richmond, 1985)。在“假设”问题的激励下,Ho和同事开发了扰动分析方法,从模拟或演化轨迹中获得对排队、库存和其他离散事件系统参数的敏感性(Ho, 1987; Ho & Cao, 1983)。

有趣的是,Forrester继续在更广泛的背景下探索动力学;1969年,他出版了《城市动力学》(Forrester, 1969),对城市地区的人口住房和工业进行了建模;1971年,他出版了《世界动力学》(Forrester, 1971),对全世界的人口、能源和污染进行了建模。这本书引起了新成立的罗马俱乐部(Peccei & King, 1968)的注意,该俱乐部资助了一项更详细的研究“增长的限制”(Medows, Medows, Randers & Behrens III, 1972)。Forrester最初的由四个微分方程组成的模型被扩展到大约1000个。这本书预测增长受到自然资源的限制。这是有争议的,因为许多未经验证的假设;然而,在1973年石油危机的推动下,它售出了超过1200万本。它的核心论点目前在全球变暖以及其他环境和生态问题上具有重大的主题重要性。

在一篇影响深远的论文中,Kimmia和Gershwin(1983)将机器随机故障和维修的柔性制造系统的短期调度问题作为一个随机控制问题进行了阐述,并展示出有趣的切换结构解决方案。在某些情况下,所产生的随机最优控制问题已被明确解决,以确定最优套期保值点政策(Akella & Kumar, 1986; Bielecki & Kumar, 1988)。Kimmia和Gershwin还阐述了制造系统的动态系统方法,并提出了整体制造问题的分层时间尺度分解,涉及从高端的长期产能规划到低端的短期零件装载问题。

动态系统观点在(Perkins & Kumar, 1989)中得到进一步发展,他们强调了保持缓冲级别稳定的调度策略的重要性。反例表明,当机器之间存在有效的双向交互时,即使是简单的网络也可能因调度策略而不稳定,即“反馈”(Bramson, 1994;Kumar & Seidman, 1990; Lu & Kumar, 1991; Seidman, 1994)。人们努力了解制造系统和排队网络的稳定性。提出了建立排队网络稳定性的一种强有力的方法,即液限法(the fluid limit approach)(Dai, 1995; Rybko & Stolyar, 1992),作为对原始随机系统的直接Lyapunov分析的补充,该分析采用了Foster的马尔可夫链正递推准则(Foster, 1953)。

另一种研究性能的有效方法是基于排队网络的布朗运动模型(Harrison, 1988)开发布朗网络模型。它们可以用来近似排队网络的繁忙交通行为(伊格尔哈特和惠特, 1970a, b)。流体极限类似于提供平均值信息的大数定律,而布朗极限类似于提供方差信息的中心极限定理。这项工作涉及的一个典型系统是半导体制造厂,它们具有可重入物质流(Kumar, 1993;Wein, 1988),即产生反馈效应的回路。基于将制造系统视为动态随机系统的方法的政策(Lu, Ramaswamy & Kumar, 1994)在IBM的200 mm晶圆厂实施(Morrison, Campbell, Dews & Lafreniere, 2005)。目前人们对随机处理网络很感兴趣(Harrison, 2000)。它们允许对比排队网络更通用的系统进行建模,允许缓冲区、资源和活动之间进行复杂的交互。它们不仅包括制造系统的模型,还包括分组交换机、呼叫中心等的模型。

与静态确定性模型相比,这些控制相关发展的累积影响,在强调制造业和其他此类系统的动态随机性方面具有变革性。关于QueuingSystems,20世纪初由于Erlang(Brockmeyer, Halstrom, Jensen & Erlang, 1948; Erlang, 1948)的第一批工作是由电话问题推动的,20世纪50年代由于Jackson(1957)的第二批工作是由工作场所问题推动的,第三批工作是由计算机系统问题推动的(BaskEtt, Chandy, Muntz & Palacios, 1975)。第四波是受半导体制造问题的驱动,最近一波旨在整合资源调度中非常普遍的问题,这受到控制理论的强烈影响。

将供应链管理和企业资源规划(ERP)的业务系统与车间的过程控制系统集成有显著的优势,这使得过程控制与业务目标相匹配成为可能。典型的目标是提高吞吐量、降低能耗、提高产能利用率和降低质量可变性。过程控制系统DCS和PLC系统用于过程控制,由SAP和IBM等公司提供的ERP(企业资源规划)、MRP(物料资源规划)和主计划系统等业务系统用于工厂管理和业务运营。为了支持业务系统和过程控制系统之间的互操作性,通常使用一个中间层,称为MES(制造执行系统)。国际标准IEC 62264(国际电工委员会, 2013),也称为ISA95,为企业控制系统集成提供支持(Brandl, 2006; Scholten, 2007)。

4.15 仿真、计算和建模

仿真是有用的,因为它允许在一个安全的环境中探索复杂系统的行为。机械式微分分析仪的产生是由了解电力系统的需求所驱动的,电子模拟计算机是为了模拟控制系统而发明的,如第2.7节所述。到1960年,许多行业和一些大学都有模拟计算。在世纪之交,所有工程师和学生的办公桌上都可以随时看到模拟工具。在控制器交付之前,模拟器还与硬件结合测试控制器,称为硬件在环模拟

使用数字计算机进行模拟的思路是很自然的(Redmond & Smith, 1980)。这一思路来源于一篇论文(Selfridge, 1955),该论文展示了数字计算机如何模拟微分分析仪,(Brennan & Linebarger, 1964; Tiechroow, Lubin & Truitt, 1967)微分方程数值积分的进展引发了大量相关研究(Dahlquist, 1959; Fehlberg, 1964; Henrichi, 1962)。到1967年,已有20多个不同的程序可用,例如IBM的CSMP(Brennan & Silberberg, 1968)。模拟委员会公司(Sci)创建了CSSL标准(Strauss, 1967),这是一个重要的里程碑,因为它统一了概念和符号。ACSL计划(Mitchell & Gauthier, 1976)是基于CSSL的,它随后成为了标准。与它的前辈一样,acsl作为Fortran的预处理器;用于集成的代码与表示模型的代码交错。将FORTRAN语句作为模型的一部分是很容易的,但是文档和维护是很困难的。另一个限制是使用模拟计算的低级元素来表示计算。ACSL是一个批处理程序。初始条件或参数更改时需要重新编译。人机交互明显不如传统的模拟计算。Simnon系统(Elmqvist, 1975)以交互方式接受参数和初始条件的更改,而无需重新编译。模型是用一种特殊的语言描述的,它有一个正式的定义,一种简单的语言也用于交互。许多其他的模拟器出现在个人电脑上。

70年代计算机的普遍应用激发了控制系统分析和设计工具的发展。计算机辅助控制系统设计已成为一个学术上和会议目录中的分支学科。最初,工业界和大学发展了自己的系统。80年代中期个人电脑和图形的出现刺激了新一代软件的诞生。这本书进行了很好的总结(Jamshidi & Herget, 1985)。

由于设计计算是基于数值算法,因此出现了与数值数学研究人员的合作。特别重要的两个领域是数值线性代数和微分积分、微分代数方程。数值分析人员开发了可靠的计算机代码,用于求解Lyapunov和Riccati方程(Laub, 1994),并用于积分微分和微分代数方程(Ascher & Petzold, 1998; Gear, 1971; Gustafsson, 1993; hairer, lubich & roche, 1989; hairer, n_rsett & wanner, 1987; hairer & wanner, 1991)。

MatlabCleve Moler1981年创建,它是一个重大革新。Moler参与了Linpack和Eispack数字线性代数软件库的开发,他希望有一个简单的方法来测试这些程序。他设计了一种解释性编程语言,在这种语言中,输入矩阵和输入简单命令来执行计算非常容易。Moler还添加了允许用户扩展语言的函数和宏(脚本)。

控制系统采用MATLAB语言,开发了相应的控制系统设计工具。两个公司在帕洛阿尔托进行了开创性的工作。Systems Control公司开发了ctrl-c(Little, Emami Naeini & Bangert, 1985),Integrated Systems公司开发了Matrixx和SystemBuild(Shah, Floyd & Lehman, 1985);两个系统都基于Moler的Matlab。

John Little曾在Systems Control公司工作,他获得了开发PC版本的权利,并与Moler和Bangert合作成立了Mathworks公司。Mathworks开发了Simulink模拟器(Grace, 1991)(最初称为Simulatb),与Matlab集成,以及StateFlow,一个有限状态机的模拟器(Hamon & Rushby, 2005)。Matlab和Simulink是主导产品,但也有其他类似的软件。程序SysQuake(Piquet, 1998)具有高度的交互性,可执行文件可以自由分发。共有两种公共领域产品:Octave(Eaton, 1988)和Scilab(Inria, 1990)。人们也正在使用脚本语言python开发控制系统设计工具(Python, 2001)。

John Little鼓励控制研究人员开发用于解决控制问题的工具箱,计算机辅助控制系统设计的大部分工作都迁移到了Matlab。工具箱为组合理论提供了一种方便的方法,并使其广泛应用。Mathworks还开发了用于从Simulink生成嵌入式系统代码的软件。

国家仪器(NI)为仪器提供计算机接口。1986年,NI的Kodosky开发了程序LabVIEW,允许灵活配置带有美观图形面板的仪器(Josifovska, 2003; Kodosky, Maccrisken & Rymar, 1991)。该程序基于数据流编程。它最初是用来模拟电子仪器的,但在控制应用中也很流行。获得Matrixx的国家仪器及其特性正逐渐向LabVIEW迁移。

模拟需要建立过程和控制器的模型。由于应用范围广泛,控制工程师需要许多不同领域的模型。即使特定领域的建模工具可用,也很难将它们组合起来。因此,非常希望有一种跨越不同领域的统一建模方法

一种简单而通用的建模方法是将系统分成子系统,定义接口,为子系统编写平衡方程,并添加本构方程。这种方法生成了一个描述,它是通用的、接近物理的,并且便于构建库。缺点是,将子系统组装成一个适合模拟或优化的模型需要大量的手工工作。大部分工作可以使用计算机代数和面向对象编程实现自动化。该过程产生的模型是微分代数方程。20世纪80年代,此类方程的数值解有了重大进展(Ascher & Petzold, 1998; Brenan, Campbell & Petzold, 1989; Gear, 1971; hairer & wanner, 1991)。建模方法已用于电子电路(Nagel & Pederson, 1973)。Dymola语言,由Elmqvist(1978)开发,将该方法扩展到一般物理领域。Dymola有一个正式的定义,并在Simula中实现(Birtrintle, Dahl, Myhrhaug & Nygaard, 1973),这是当时唯一可用的面向对象的环境。当更多的内存和计算能力变得可用时,许多其他面向对象的建模语言随后被开发出来,例如(Breunse & Broenink, 1997; Elmqvist & Mattsson, 1989; Fritsson, Viklund, Fritsson & Herber, 1995; Jeandel, Boudaudad, Ravier & Buhsing, 1996; Jochum & Kloas, 1994; Mattsson & Andersson, 1993; Mattsson, Andersson, 1993; Nilsson, 1993; Oh & Pantelides, 1996; Piela, Epperly, Westerberg & Westerberg, 1991; Sahlin, Bring & Sowell, 1996; Viklund & Fritsson, 1995)。1992年,Elmqvist启动了Dynasim公司,将Dymola的现代实施推向市场。该计划很快获得了业界的认可,例如,它被用来开发丰田普锐斯。Dynasim后来被达索系统收购。

1996年,欧洲开始合作开发物理建模语言。它是由一个有着广泛经验的多样化群体进行的:来自许多领域的建模者、控制工程师、软件工程师、计算机科学家和数字分析师。几乎所有的欧洲模特团体都参加了。这项工作促成了Modelica协会的成立(1996年)。第一个任务是建模语言的正式定义;第一个版本于1978年推出(Elmqvist, Mattsson & Otter, 1998年)。Modelica语言具有许多有用的特性,如变量单位、矩阵和矩阵方程、函数、混合建模特性和类参数。人们一直致力于开发模型库。有许多不同领域的库,例如控制系统、多体系统、电路、液压系统和热力系统。开源Modelica标准库包含大约1000个模型组件和来自多个域的500多个函数。Modelica活动已展开,有用于高级开发、语言规范和库的组。此时也出现了相关的教科书(Fritsson, 2011; Tiller, 2001)。2013年召开第80次设计会议,2014年召开第10次Modelica会议。市场上有几种Modelica仿真环境,也有开源版本(Modelica Association, 1996)。在Modelica中开发的模型可以导出到Simulink领域。

4.16 促进控制发展的相关学术组织

国际自动控制联合会(IFAC),见第3.7节,为控制提供了一个全球舞台。由于IFAC是通过国家成员组织运作的,它对全球控制的传播作出了强有力的贡献。国家成员组织也在当地组织了会议(Bittantti, 2003; Basar, 2011; Porkka, 2006)。尽管冷战期间政治紧张,但国际自动控制联合会(ifac)仍巧妙地维持了一个世界范围的控制社区。三年一次的IFAC世界大会从1960年开始运作。IFAC还组织研讨会和专题讨论会。参加IFAC活动和委员会是一种良好的培训经验,特别是对于来自小国家的控制工程师。Automatica于1969年成为IFAC官方期刊(Coales, 1969),George Axelby(Axelby, 1969)担任编辑。IFAC的活动已经大大扩展,现在几乎每周都有IFAC会议。后来,IFAC创办了几本杂志:

  • Annual Reviews of Control(1977)
  • Engineering Applications of Artificial Intelligence(1988)
  • Journal of Process Control(1991)
  • Mechatronics(1991)
  • Control Engineering Practice(1993)

除此之外,还有其他工程组织举办的重要活动。美国仪器学会(ISA)成立于1946年,2000年更名为国际自动化学会。他们每年组织一次自动化周以及会议和研讨会。ISA还出版书籍和Journals InTech和 ISA Transactions。美国机械工程师协会(ASME)于1943年成立了一个仪器和调节器部门。The Journal of Dynamic Systems, Measurement and Control杂志始于1971年。美国宇航局于1971年创办了the Journal of Guidance, Control, and Dynamics。

IEEE控制系统协会成立于1971年,见第3.7节。关于自适应过程的长期研讨会(1963-1970)成为了IEEE决策与控制会议(CDC)。有趣的是,当自适应控制的研究才开始起步时,它就这样做了。他们有慷慨的会议论文接受惯例,鼓励研究人员提交他们的最新研究并参加年度会议。它成了一个重要的控制研究者聚会地。IEEE Transactions on Automatic Control,它具有一个动态的编辑委员会,定期进行新的人才轮换,它逐渐成为理论研究论文的主要出版商。

美国自动控制委员会(American Automatic Control Council)是IFAC在美国的全国成员组织,与许多工程学会(AIAA、AICHE、ASCE、ASME、IEEE、ISA和SCS)合作组织了美国控制会议。欧洲控制会议现在每年举行一次会议,1991年在格勒诺布尔开始了一次会议。1994年发起的亚洲控制会议现在每隔一年定期召开一次。MTN组织关注系统理论中的理论问题,每两年组织一次会议。

在中国、英国、法国、德国、日本和许多其他国家也有强有力的组织来组织研讨会和出版期刊。

一些在战争中建立的组织,如麻省理工的雷达实验室被拆除,另一些组织,如麻省理工的LIDS(Mitter, 1990),伊利诺伊大学的协作科学实验室,莫斯科的控制科学研究所,以及匈牙利、中国、捷克斯洛伐克和波兰科学院管理的研究所在1960年后蓬勃发展。其他地方也建立了新的机构。日本有大型的第四代计算机和模糊控制的国家项目。

1967年,作为戴高乐信息计算计划的一部分,法国研究与工业部成立了计算机科学与控制研究所(IRIA)。它是最早将控制和计算机科学结合起来的研究机构之一。该研究所最初位于巴黎外的罗昆考特。1979年,它成为一个国家研究所,并更名为INRIA,此后扩展到8个区域研究中心。该研究所拥有近4000名员工,其中约1000名博士和500名博士后。在数学家 JacquesLouis Lions 和Alain Bensoussan卓越的领导下它成为一个强大的研究基地,INRIA与工业界有着很强的互动关系,已经参与创立了约100家公司。它开创了由偏微分方程控制系统的工作,并在INRIA开发了Scilab和Esterel等软件。

第二次世界大战后,世界范围内的科研规模有了较大的扩大,各大研究型大学也有了较大的发展。研究经费大幅增加。国家科学基金会是在美国创建的,它的同行评议模式为研究者提供了一个公平的研究场所,而不管地点如何。在第二次世界大战期间控制技术工作和曼哈顿项目的经验之后,美国国防部向大学注入了大量资金,通常以同行评审模式运作。欧盟和日本政府开始了重大的研究项目。控制研究是1960年后所有这些发展的主要受益者。来自大学在控制领域的研究大幅增长。控制学院的招聘人数大幅增加。国际化程度也很强,学生和教师在不同国家之间流动。美国得益于来自其他国家的学生和科学人才的移民。欧盟于1987年建立了伊拉斯谟计划,随后是苏格拉底、终身学习计划和玛丽·居里计划。

5 拓宽视野

2000年左右,有迹象表明控制正在进入一个新时代。传统的应用由于计算成本的下降而激增,而新的应用正在涌现。应用范围从微型和纳米级设备到大型系统,如智能国家电网和全球通信系统。互联网和蜂窝网络的迅速扩展是强大的技术驱动力,对自主性增强的系统的需求也是如此。一个重要的标志是,2013年,伊丽莎白女王工程奖授予了路易斯·波廷、罗伯特·瑟夫、蒂姆·伯纳斯·李和马克·安德烈·埃森,表彰他们“1970年开始开创性的工作,它引领了互联网和全球网络的发展。”互联网和全球网络发起了一场改变世界的通信革命(伊丽莎白女王奖基金会,2013)。这是一个有根据的猜测,它也将对自动控制产生非常强烈的影响。

同时,实践迫切需要人们开发能够高效地控制大规模复杂生产系统的方法。在曾经的黄金时代,控制从与数学的互动中得到了极大的好处。在下一个阶段,与通信工程师和计算机科学家之间的更强的互动开始发展。与物理学、生物学和经济学的相互作用也是增加的。在本节中,我们将概述一些趋势。特别需要说明的是,我们对未来事物的处理必然是推测性的。

5.1 计算机和网络的进展

计算机硬件,因为遵循摩尔定律,现在要比1960年更强大。Cray1于1976年交付给洛斯阿拉莫斯国家实验室,重量超过5吨,但只能提供250 megaFLOPS(每秒一百万次的浮点运算),而目前的Mac Pro桌面速度是原来的1000倍,能提供90 gigaflops(每秒十亿次的浮点运算)。在过去的50年里,嵌入式计算机的数量也激增了。事实上,到1998年,所有处理器中工作站只占2%,其余98%是嵌入式系统(Stankovic, 2001

软件工程取得了很大的进步。基于大型和复杂项目的经验形成了可以重复使用的设计模式、软件框架和开发过程(Gamma, Helm, Johnson & Vlistides, 1995; Pressman, 2004)。

通信网络的诞生和发展是最引人注目的变化之一。电话技术起源于1877年,它建立在电路交换网络的基础上。1969年,美国高级研究计划局(ARPA)开发了一个分组交换网络,连接四台大学计算机。1974年开发了一个灵活的体系结构(Cerf & icahn,2005),允许不同的以前不兼容的网络相互连接。它的特点是分层寻址、网络间的网关路由器和TCP协议,这是一种确保在网络间以有序方式可靠地传递数据包的协议。后来,这被分成两个协议,一起被命名为TCP/IP(CERF, 1980),TCP部分只在终端主机上运行,而IP部分负责网络之间或网络内的数据包传递。这使得扩大网络规模成为可能。

与此同时,分组无线网络也应运而生。事实上,TCP的目标之一是将诸如prnet和satnet这样的分组无线网络与arpanet互连。1971年,夏威夷大学开发了Alohanet分组无线网络,将夏威夷群岛的用户与瓦胡岛的计算机连接起来(Abramson, 1970)。核心创新点在于解决共享无线介质中多个用户之间争用的随机访问协议。这是后来以太网的核心特性(Metcalfe & Boggs, 1976),它是在1973年左右开发的。随后在IEEE802.11标准中,随机访问协议也被用于无线局域网(WLAN),该标准在全球各地的办公室和家庭中得到了广泛应用(Crow, Widjajaja, Kim & Sakai, 1997)。

在并行发展中,移动电话系统的数量也出现激增。美国第一个移动电话系统AMPS是在1971年开发的,第一个移动便携式手机是在1973年开发的。在日本,日本电报电话公司(NTT)于1979年开发了综合商用手机系统。在1960年,几个北欧国家就拥有了自己的移动电话系统。1981年,北欧移动电话网络(NMT)使在全国范围内使用移动电话成为可能。NMT于1992年晚些时候创建了全球移动通信系统(GSM),允许用户在全球范围内拨打和接听电话。来自ATT、NMT、NTT和摩托罗拉的研究人员因这些进展获得了2013年德雷珀奖(NAE, 2013)。1990年开发的蜂窝技术和万维网在全球范围内的连通性和信息访问方面创造了一场革命。

如今,使用无线连接的移动设备已超过50亿台,预计到2020年,这一数字将增加一到两个数量级(Cisco, 2013; Ericsson, 2013)。端到端延迟对控制尤为重要。在目前的LTE/4G系统中,它约为100 ms,但预计在2020年计划的5G系统中会下降到几毫秒。如此小的延迟将大大扩大通过网络控制应用程序的机会。1998年,加利福尼亚大学伯克利分校(Kahn, Katz & Pister, 1999)的智能粉尘项目开发d称为“motes”的微型设备,可以进行无线计算和通信,也可以连接传感器。Crossbow Technologies在1999年开发的Rene Mote有一个Atmel CPU、512字节的RAM、8K的闪存和一个能够以大约10 Kbps的速率进行通信的分组无线(Hill, Horton, Kling & Krishnamurthy, 2004)。Tinyos开源操作系统(Culler, 2006; Levis, 2004)是一个关键的开发,它促进了许多实验。自它们最初的发展以来,已经有了好几代的Motes。它们可以用来形成相对较大的“传感器网络”,其中广泛分布的节点可以无线通信,并对接收到的数据进行计算。如果将执行器连接到传感器网络上,那么就可以得到一些计算机科学界称之为“传感器-执行器”网络的概念,这是人们熟悉的概念。控制工程师特别感兴趣的,一个是WielsHART,它被设计为过程控制的通信标准。另外一个是国际自动化学会(ISA, 1945)开发的ISA100.11A。

5.2 网络化控制

在多个传感器和执行器之间可以通过基于分组的网络传输。因此,网络技术的进步使得大规模部署控制系统成为可能,从而产生“对网络的控制”,或被称为“网络控制”(Baillieul & Antsaklis, 2007)的这个概念。由于环路在通信网络上是闭合的,因此它在整体稳定性和性能方面起着重要作用。而且网络需要控制以提供良好的性能,这是一个称为“网络化控制”的领域。

拥塞控制是在网络中使用反馈的早期例子。在保持高吞吐量的同时,对向网络中注入数据包的速率进行调节以避免拥塞(Jacobson, 1988)。事实上,TCP(后来的TCP/IP协议)正是互联网的核心,也是互联网迅速发展的原因之一。一般来说,网络的运行需要多个层次的控制原则和控制回路。早期的ALOHA协议(Abramson, 1970)是WiFi的一个组成部分,它是一种反馈控制方案,当节点造成太多的数据包“碰撞”时,它会尝试以类似于James Watts州长的方式限制节点。

李亚普诺夫理论在高速交换机和无线网络的设计中具有非常重要的影响。在一篇有影响的论文中,Tassiulas和Ephermides(Tassiulas & Ephermides, 1992)分析了一种“最大权重”调度算法,其中权重是队列长度的函数,并使用二次Lyapunov函数证明了其稳定性。随后,最大权重算法在输入排队交换机中实现了100%的吞吐量,这对交换机和路由器设计产生了重大影响(McKeown, Mekkittikul, Anantharam & Walrand, 1999)。最近,证明了基于队列长度的“反压力”算法可以使无线网络的吞吐量最佳(Eryilmaz & srikant, 2006; Lin&Shroff, 2004; Lin, Shroff & srikant, 2006; Neely, Modiano & Li, 2005)。控制系统必须设计通信网络,以提供控制回路所需的“服务质量”。网络不仅必须以指定的吞吐量将数据包从传感器发送到执行器,还必须在指定的延迟内发送。当前的互联网被称为“最大努力”;它不提供这样的保证,但如果要关闭网络上的循环,这些保证是很重要的。CANBUS和现场总线系统(Chatha, 1994)设计用于控制应用。主要挑战是设计提供这种服务质量的无线网络。例如,可以用一个无线接入点来取代目前连接大约75个传感器和100个交换机的有线车内网络,因为这样可以减轻重量、降低制造的复杂性、允许更容易地升级等。描述哪些类型的服务接入点可以支持的质量问题以及如何做到这一点,是研究者非常感兴趣的

关于网络控制,诸如系统设计、稳定性证明或性能建立等问题需要考虑到不完善网络的特点,在该不完善网络上,传感器到执行器或执行器到传感器的信息可以被传输。这个问题可以在不同的粒度上得到解决,以考虑到所涉及的网络或通信通道所构成约束的不同方面(low、paganini和doyle,2004年)。

在控制系统设计中,最早要面对的问题之一可能是何时对系统进行采样,以减少需要通过网络传输的数据。当然,我们可以定期或在给定的时间点取样;这让人想起黎曼积分的定义方式。但是,即使没有任何变化,也可能导致系统不必要地进行采样。另一种方法是在事件驱动的基础上对其进行采样;这让人想起Lebesgue积分的定义方式。

从网络传输数据包角度来看,具有三个重要特征:网络处理传入数据包的速度、由于网络上的流量负载,数据包在到达预定目的地之前可能遇到的延迟,以及网络可能遇到丢弃数据包的概率或可能性。这三个方面都对控制系统有影响。对于LQG系统,相关卡尔曼滤波器的稳定性取决于包含观测数据包丢失的概率(Snyder & Fishman, 1975)。对于控制问题,为了使给定的线性系统稳定,确定信道提供的数据率是十分有意义的(Nair & Evans, 2004);这也与如何量化控制测量的问题有关(Brockett & Liberzon, 2000; Wong & Brockett; 1999)。在更基本的层面上,当人们希望通过包含噪声信道的控制回路使不稳定系统稳定时,对信息理论能力提出了特定于控制的概念,例如“随时随地能力(anytime capacity)”(Sahai & Mitter, 2006)。

5.3 计算与控制

计算机科学界对控制越来越感兴趣,反之亦然。一个原因是反馈在计算系统中的使用越来越多。另一个是嵌入式计算系统的扩散。汽车中大量的计算机控制系统推动了对控制系统自动化设计、生产和测试的需求。此外,随着以计算机为特征的系统在反馈回路中日益复杂,需要可靠的系统设计方法和工具。在许多复杂的应用中,设计安全可靠的系统是很重要的。

与“网络控制”类似,控制也越来越多地应用于计算系统。主要的驱动因素是灵活性的提高和服务质量的提高,以及节约能源和成本的愿望。在从智能手机等嵌入式计算机到承载基于服务器的云应用程序的数据中心的各种系统中,基于反馈的技术已用于资源(如CPU时间、内存、IO带宽和电源)的动态管理和调度。成功的应用程序已经在Web存储系统、高性能服务器系统、实时数据库、软件性能调整和多媒体流等方面得到开发。

在相反的方向上,计算机科学中的一些子团体与控制之间的互动由来已久。实时社区就是一个很好的例子。1961年,IBM 1720过程控制计算机系统安装在三个工厂。实时系统的理论基础是从Liu和LayLand(1973)的工作开始的。这项开创性的工作考虑了如何调度一个CPU来服务于多个任务的问题,其中每个任务中的作业都是周期性的,并且需要一定的执行时间。他们制定的速率单调策略,根据任务作业到达的频率对作业进行优先级排序。这是一个特别简单的静态优先级策略,已经得到了广泛的实施。对于大量任务,速率单调调度保证在CPU利用率小于log 2=0.68的情况下,所有任务都能正确执行。这种保守性可以通过应用基于反馈的调度算法来降低。体现实时计算在控制系统中的重要性的一个突出例子是1997年在火星探测器上发生的实时计算系统中的优先级反转问题(Jones, 1997; Reeves, 1997)。实时系统的研究人员也开始解决控制回路的鲁棒性问题,其中鲁棒性包括实现中的错误。seto、krogh、sha和chutinan(1998)的所谓“simplex”体系结构;sha(2001)解决了新控制算法实施过程中软件缺陷的鲁棒性问题。

我们预测,未来控制系统的一个重要方面是由微分方程模拟的物理世界计算世界的逻辑动力学之间的相互作用。通常,我们希望建立包含这两者的复合系统的属性。混合动力系统这一新兴领域是解决这些挑战的一种尝试(Benveniste, Bourke, Caillaud & Pouzet, 2012年; Henzinger & Sastry, 1998; Lee & Zheng, 2007; Maler, 2010)。它是控制和计算机科学的一个有趣的结合点。为达到这个目的,研究者使用了混合自动机模型(Henzinger, 1996)。确定范围集是有意义的(Alur & Dill, 1994)。例如,要确定系统是否“安全”,即它从未达到不安全状态。计算此类数量的软件工具是有用的,例如(Larsen, Pettersson & Yi, 1997)。然而,对于一般模型来说,确定这一点是不可事先决定的,描述可决定的内容是有意义的(Alur, 1995; Henzinger, Kopke, Puri & Varaiya, 1995)。一般来说,人们希望建立诸如整个系统的安全性和活跃性等属性,例如自动化分布式运输系统(Graham, Baliga & Kumar, 2009; Kim, 2013)。

更广泛地说,“时间”是控制系统的一个基本问题,而不是通用计算(ptolemaeus, 2014)。也就是说,对于安全关键系统,交互的及时性对于维护安全、稳定等至关重要。时间触发体系结构是开发分布式嵌入式系统的一种方法,旨在通过时间协调实现可靠性(Kopetz & Bauer, 2003)。当关闭无线网络上的环路时,同步时钟存在一定的限制;某些延迟和时钟偏移的组合无法解决(Freris, Graham & Kumar, 2011)。

控制系统的关键之一在于安全。因此,安全是一个主要问题。它们可能对通过它们所连接的网络发生的攻击有所适应。最近的Stuxnet蠕虫专门攻击控制系统(Cherry, 2010; Falliere, O’Murchu & Chien, 2011; McMillan, 2010)。还有其他一些报告较少的天然气管道系统(Schechter, Jung & Berger, 2004)、水系统(Esposito, 2006)、监控和数据采集系统(Slay & Miller, 2007)、有轨电车(Leyden, 2008)和电力公司(Greenberg, 2008)的攻击。普通数据网络的防御已经存在问题,而复杂控制系统的防御更是如此,因为攻击可以利用网络、计算、控制系统和物理层之间的复杂交互。在安全领域需要做很多工作(Neuman, 2009)。目前正在进行一些标准化工作(国际自动化学会, 1999;Slay & Miller, 2007; Stouffer, Falco & Scarfone, 2011)。

自动控制有很强的数学基础。这种相互作用是双向的;广泛的数学已经在控制中得到了应用,控制偶尔也刺激了数学的发展。一些例子包括系统理论、最优控制、随机控制和非线性控制(Fleming, 1988; Murray, 2003)。随着通信、控制和计算的融合,混合系统和实时信息理论等新的理论领域应运而生。稳定性、性能或安全理论也需要跨越不同的领域,因为最终决定性能的是整个系统。在某些特定的系统中,可以提供包括离散事件动力学、实时调度、运动学等在内的整个系统性能的整体手工证明(Graham, 2009)。然而,随着我们建立更复杂的系统,如自动航空运输系统,有必要自动化安全证明。然而,复杂度是计算过程中的一个主要挑战,因此控制研究人员需要开发新的理论,以允许可追踪的建模方式

5.4 自主

如第4.12节所述,对自适应和学习系统的研究已经发展了很长一段时间。然而,将来需要更高层次的自主,包括认知和推理。NAE研究(NAE, 2004)指出:

从某种意义上说,一切都将是明智的;也就是说,每一种产品、每一项服务和每一个基础设施都将与它所服务的人类的需求相协调,并使其行为适应这些需求。

上世纪末,恩斯特·迪克曼对机器人汽车进行了有趣的实验。他为汽车配备了摄像头和其他传感器(Dickmanns, 2007)。1994年,他在巴黎附近的一条高速公路上展示了自己的驾驶能力,1995年,他的一辆汽车以175公里/小时的速度从慕尼黑自动驶向哥本哈根。这辆车能够超车和变换车道。最近在2007年,几辆自动汽车在一个废弃的城市参加了DARPA大挑战赛。其中一条规定要求汽车遵守加利福尼亚州的交通规则。最近,谷歌开发了一款无人驾驶汽车(Guizzo, 2011)。卡内基·梅隆的BOSS是另一辆自主汽车(Rajkumar, 2012)。即使没有大规模地引入完全自主性,新汽车也能提供诸如避碰、车道引导和停车辅助等要素。自动飞行器正在运行,最近,一架黑鹰直升机执行了一项无人货物任务(华盛顿,2013)。

类人机器人是高度自治的系统的其他例子。日本的研究在这一领域尤其占主导地位。几代机器人已经开发出来了。丰田最近发布了一款小提琴演奏机器人。作为病人的类人机器人已经被开发出来训练牙医。

5.5 基于模型的设计

20世纪70年代,汽车工业开始对控制系统的计算机辅助设计产生影响,当时汽车中引入了计算机控制,这一发展在系统变得更加复杂时逐渐加速。2012年生产了超过8000万辆汽车;普通汽车可能有10个或更多的电子控制单元(ECU),而高级汽车可能有100多个电子控制单元。有了这个规模,使得有效的工程程序来设计和制造系统变得重要。控制器通常是与工厂共同设计的。许多其他行业也有类似的需求,即使数量较小。

开发通常包括以下任务:需求、建模、控制设计、代码生成、实现、硬件在线仿真、调试、操作和重新配置。在不同的任务之间插入验证(Verification)、确认(Validation)和测试,因为在设计过程的后期发现错误很昂贵。由于模型是过程的关键元素,因此被称为基于模型的设计(MBD)。使用模型的好处是需要建造的原型更少;尤其是在建造像混合动力汽车这样的新系统时。航空航天和汽车工业是MBD的早期采用者,目前发展迅速(Guzzella & Sciarretta, 2013;Kiencke & Nielsen, 2005)。使用MBD得到NAE研究(NAE, 2004)的支持:

“随着新工程结构的建立,模拟和建模领域将不断增长。基于计算机的设计-建造工程。…将成为大多数产品设计的规范,加速创建多个子系统组合成最终产品的复杂结构。”

使用MBD的一个例子是,德国汽车车内环境控制系统部件供应商现在不仅提供硬件,还提供其设备的经验证的动态模型(Limerich, Braun, Schmitz & Pr_lss,2005)。这使得汽车制造商可以模拟整个系统,并探索使用不同供应商的部件对燃油消耗和舒适性的影响。

在系统设计中,需要探索设计选择并研究几个过程配置。自动控制的一个主要原则是相信被控制的系统是先验的。通过修改过程或系统架构,可以缓解难以解决的控制问题。过程及其控制器的集成设计是非常理想的。如第2.5节所述,莱特兄弟在其他公司失败的情况下成功了,因为他们故意设计了一种可操纵的不稳定飞机,而飞行员用于稳定作用。拥有一架依靠控制系统进行稳定的不稳定飞机仍然有很大的优势。现代战斗机以这种方式获得性能。

设计过程的某些阶段有工具:DOORS for requirements(IBM, 2013),例如设备设计的CAD程序、建模的Modelica、控制设计的Matlab以及模拟和代码生成的Simulink。还提供文档和版本控制系统。即使想要一个完整的设计套件,一个软件包也不可能满足所有的需求。因此,软件工具的设计必须使它们能够组合在一起。举个例子,达索系统公司将Dymola/Modelica与他们的CAD程序CATIA结合在一起。这意味着3D几何数据、质量和惯性可直接从CAD系统获得。高质量的3D渲染也可用于动画模拟结果。

工业仿真界最近的一个发展是引入了功能模拟接口(FMI),旨在促进已编译动态模型层次上的工具互操作性。FMI为模型元数据(如名称和单位)指定XML模式,并为模型方程的计算指定C API。2010年推出了第一版FMI,此后大量工具采用了该标准。未来版本的FMI将支持XML格式的完整模型通信,该格式适用于符号工具的集成,这些工具可以探索模型结构,而不仅仅是评估模型方程(Parrotto, _Kesson & Casella, 2010)。

汽车制造商通常从供应商那里购买由传感器、执行器、计算机和软件组成的系统。这种方法在只有几个相互作用很小的电子系统的情况下非常有效。当增加更多的控制功能时,情况变得复杂起来,因为来自一个子系统的传感器可以用于另一个系统。因此,汽车行业,包括其供应商和工具开发商,为汽车电气和电子系统创建了汽车开放系统体系结构(Autosar),这是一种开放和标准化的汽车软件体系结构(Autosar, 2013)。

在设计和实现控制系统之后,会出现许多有趣的问题。首先,必须对系统进行调试,所有控制回路必须投入运行。因此,有必要不断地监督和评估系统是否正常运行。这一阶段出现的许多问题最近才开始以系统的方式加以解决。典型的问题是故障检测和诊断,但也有许多其他有趣的问题,如回路评估和性能评估。这一领域的发展受到安全和高质量驱动的强烈推动。适当的控制设计会对调试产生重大影响。例如,自动调谐器可以大大简化调试过程。

当自动控制系统成为过程的关键部分时,它也可能成为核心任务,这意味着如果控制系统发生故障,系统将失败。这对控制系统的可靠性提出了强烈的要求。关于这一结果的有趣讨论可以在Stein(2003)的IEEE Bode演讲中找到。

5.6 网络-物理系统(CPS)

随着通信技术的不断应用,以及控制系统设计和操作中软件的复杂度和复杂性的增加,控制、计算和通信之间的交互更加紧密。它还促进了大规模控制系统的发展。正如前一个时代的情况一样,继模拟和数字控制之后,第三次潜在的平台革命也正在创造一个严格设计框架的需要。

一些研究资助机构也促进了这种互动。DARPA于1999年启动了一个名为“软件嵌入式控制”的研究项目(Samad & Balas, 2003年),随后是一个关于嵌入式和混合系统的NSF项目。欧盟于2001年启动了先进实时系统的艺术家项目(Artist FP5, 2006)。随后是艺术家2和艺术家设计。2006年,美国的一组研究人员和项目经理创造了一个名称“网络-物理系统(CPS)”,用来描述控制、计算、通信和网络日益紧密的耦合。在美国,美国国家科学基金会在网络物理系统中建立了一个重要的研究资助项目(BaHeTi & GILL; 2011)。在其2020年战略计划(INRIA, 2013)中,INRIA强调“大型数字、嵌入式和嵌入式系统以及系统体系的挑战”。罗伯特博世网络物理系统中心于2011年在印度科学院成立。在瑞典,战略研究基金会支持了10年的林纳斯奖,资助了三个支持控制研究的中心(Access, 2008; LCCC, 2008; MOVIII, 2008)。

2008年,为期一周的年度活动“CPS周”启动,其中包括五次会议、ACM/IEEE网络物理系统国际会议(ICCPS)、高可靠性网络系统会议(HICONS)、混合系统:计算与控制(HSCC)、ACM国际会议。传感器网络信息处理(IPSN)和IEEE实时与嵌入式技术与应用研讨会(RTAS)。2013年,IEEE的会议记录庆祝了IRE百周年(IEEE由IRE和AIEE联盟于1963年成立),并出版了一个100周年纪念版,其中网络物理系统是19个选择纳入的主题之一(Kim & Kumar, 2012)。人们对“物联网”也很感兴趣,它的重点是连接大量的普通实物,从牛到汽车到咖啡机,市场规模预计到2020年将达到500亿。IEEE正在启动两个新的期刊,IEEE Transactions on Control of Network Systems、IEEE Internet of Things Journal.

5.7 系统的复杂性

工程系统越来越复杂,这是一个普遍的趋势。复杂性是由许多机制产生的:子系统的大小、交互和复杂性是其中三个因素。

化工过程控制系统可以有数千个反馈回路。再循环方案节省能源和原材料,减少污染,但它们引入了从输出流到输入流的耦合,从而产生相互作用和复杂性。利用计算机辅助供应链在全球分销货物的高效系统,使用复杂的货物和信息运输网络。具有自适应光学的天文望远镜可能具有大量反射面,反射面的方向由反馈系统单独控制。即使在一个小系统中,由于“维数的诅咒”,离散化后的结果也可能非常大。

过去五十年的重大成就之一是随着计算规模的增加,研究计算复杂性具有严格基础,尽管一些基本问题仍然是开放的。包括控制系统设计和分析在内的许多应用领域面临的一个基本挑战是,开发能够产生复杂度在系统规模上按多项式(最好是低阶)缩放的可处理算法的模型。

互联网和电网可能是最复杂的工程系统之一。这两种方法都非常依赖于不同层次的反馈。如第5.2节所述,对于前者,这就是网络控制的含义。适用于小型系统的算法可能不适用于大型系统。确定比例律也很有意义,它可以洞察系统性能如何随着大小的增长而变化。

另一个吸引人们极大兴趣的问题是如何利用大量数据(称为“大数据”)。这对于理解大型社会经济技术系统的行为尤其有用,因为这些系统的“物理特性”尚未被很好地理解。例如,由可再生能源提供并由价格控制的新兴智能电网的需求响应控制。

引入复杂性的另一个因素是系统是混合的:连续系统混合了逻辑和顺序。汽车巡航控制就是一个简单的例子。在过程控制中也有其他例子,其中许多连续控制器与逻辑和顺序系统结合。这样的系统很难分析和设计。现代汽车是一个复杂系统的例子;它有几个网络和多达100个电子控制单元。这类系统的规范、设计、制造、运行和升级是一项日益复杂的任务。

5.8 物理

物理学家和工程师之间的相互作用正在增加(Bechhoefer, 2005)。反馈控制系统在物理仪器中起着至关重要的作用,随着实验复杂性的增加,反馈控制系统的作用越来越明显。例如,调节器被用来跟踪早期望远镜中行星的运动(麦克斯韦, 1868),反馈是早期分光计的一个基本要素,1912年诺贝尔物理学奖被授予古斯塔夫·达伦,因为他“发明了用于灯塔和浮标照明的储气器的自动调节器”(Nobelstiftelsen, 2013)。荷兰工程师范德梅尔(van der Meer)因在粒子加速器中产生高密度光束而获得了1984年诺贝尔物理学奖(Nobeltiftelsen, 2013)。

反馈也被证明对物理实验至关重要。大型望远镜使用自适应光学来减少由大气密度变化引起的干扰。控制系统也广泛应用于微尺度和纳米尺度(Eleftheriou & Moheimani, 2012; Gorman & Shapiro, 2012)。宾宁和罗勒因发明扫描隧道显微镜而共享1986年诺贝尔物理学奖。原子力显微镜是生物学家和材料科学家的标准工具,能够提供亚纳米级分辨率的图像。仪器中的控制系统是至关重要的;改进的控制可以在更清晰和更快的成像方面立即带来好处。现代控制工程在大型强子对撞机(LHC)的运行中面临着巨大的挑战。许多相互作用的系统部件在不同数量级的时间尺度上工作,从粒子束转向的纳秒到冷却大型电磁铁的几个月。

控制也在更基本的层面上产生了影响。很久以前,人们试图通过线性化Navier-Stokes方程来解释剪切流湍流。假设线性化方程在雷诺数增加时会变得不稳定,这在一定程度上出乎意料地没有发生。Bamieh和Dahleh(2001)在线性分析的基础上进行了另一次尝试。他们基于线性化模型计算了将表面不规则映射到速度的操作者的增益,发现增益随着雷诺数的增加而增加,其方式与实验数据兼容。

控制也被应用于量子系统(Fradkov, 2007; Huang, 1983; Khaneja, 2001),核磁共振成像(Khaneja, Reiss, Schulte Herbr_ggen & Glaser, 2005)是一种应用。另一个引人注目的应用是在Brown和Rabitz(2002)中提出的,他们提议通过应用非常快的激光脉冲将分子分解成离子。该问题可以表述为分子薛定谔方程的最优控制问题,其准则是以最小能量破坏分子。

5.9 生物学和医学

1932年,生理学家沃尔特·坎农(Walter Cannon)撰写了《人体的智慧》(Cannon, 1939)一书,在书的前言中他说:

我们的身体是由非常不稳定的物质构成的。如此微小以至于需要非常精密的方法来测量它们的能量脉冲,沿着我们的神经。…身体结构的不稳定性也表现在它在条件改变时的快速变化。…生物机制维持自身稳定的能力一直给生物学家留下深刻印象。

他接着说:

由物质组成的有机体,其特点是极不稳定和不稳定,不知何故,机体学会了极其令人不安的情况下保持稳定和稳定的方法。

坎农的书是基于通过仔细观察和实验获得的见解。在我们的术语中,我们可以将上述陈述概括为:人体拥有惊人的控制系统。然而,从这一定性陈述到基于模型和分析的定量结果还有很长的路要走,如《生活工作方式》一书中的以下引述所示(Hoagland & Dodson, 1995):

反馈是生活的中心特征。所有的有机体都有能力感知自己的行为,并做出必要的改变。反馈的过程控制着我们如何成长,如何应对压力和挑战,以及如何调节体温、血压和胆固醇水平等因素。从细胞中蛋白质的相互作用到复杂生态系统中生物体的相互作用,这些机制在各个层面上都起作用。

在研究生物系统时广泛使用反馈思想。霍奇金和赫胥黎获得1963年诺贝尔医学奖,因为他们“发现了与神经细胞膜周围和中央部分的兴奋和抑制有关的离子机制”。他们还使用了一个巧妙的反馈系统来研究动作电位在轴突中的传播。Neher和Sakmann进一步完善了测量技术,他们因在细胞中发现单离子通道的功能而获得1991年诺贝尔生理学或医学奖。

如今,有许多努力为患者和医生开发有效的工具,并增强身体的自然反馈系统(Doyle III, 2011)。机器人手术现在已经很成熟了。机械心脏已经在使用。进行了血糖在线控制实验(Sansum糖尿病研究所, 2013l Parker, Doyle III, Peppas, 1999),以及麻醉自动控制,举几个例子。

对动物自身的控制系统研究正在进行中。通过风洞和自由飞行试验,对昆虫和鸟类的行为进行了研究。它还试图制造模仿动物的人造装置。一些更基本的功能,如站立、行走和跑步,现在可以由机器人完成(Westervelt, 2007)。其中一些功能是涉及稳定和调节的简单控制任务,但还有许多更复杂的任务需要认知。大阪大学(Osaka University)的石黑浩(Hiroshi Ishiguro)教授在这方面做出了有趣的努力,他设计了几个类人机器人(Asada, Macdorman, Ishiguro & Kuniyoshi, 2001)。合成生物学实验也在分子水平上进行(Andrianantandro, Basu, Karig & Weiss, 2006)。

人们对控制和系统生物学越来越感兴趣(Cury & Baldissera, 2013; Gaohua & Kimura, 2009; Iglesias & Ingalls, 2009; Khammash & El Samad, 2004)。起源于1988年的系统生物学不是采用由研究一个孤立的实体组成的还原论方法,而是旨在了解这些成分如何作为动力系统相互作用,无论是在细胞还是器官层面。因此,它旨在揭示生物和疾病网络的复杂性。系统生物学研究所(2012)的一句引言总结了这一点:

即使是最简单的活细胞也是一个极其复杂的分子机器。它包含DNA和RNA的长链,编码细胞功能和繁殖所必需的信息。大而复杂的折叠蛋白质分子催化生命的生化反应,包括细胞组织和生理学。小分子在细胞内和细胞间传递信息、能量和原材料,并在新陈代谢过程中进行化学转化。从整体上看,细胞就像一个巨大的城市,充满了人和物,充满了活动。

控制工程师和生物学家之间的互动越来越多,各大大学正在建立新的学术部门和教育项目。

5.10 经济

经济学家和控制工程师在博弈论、投入产出模型、随机控制、优化和系统识别(计量经济学)等方面有着共同的兴趣。本文已经提到了经济学家西蒙、纳什和阿罗。

早期的经济学工作是由亚当·斯密和梅纳德·凯恩斯完成的。凯恩斯的工作主要是概念性的,但他也引入了一些简单的模型,这些模型对于1930年代大萧条时期的经济复苏非常重要,例如乘数的概念,它表明了投资对GDP的影响。评价经济学研究的一种方法是看自1969年第一次获得经济学奖以来,为纪念阿尔弗雷德·诺贝尔(Alfred Nobel)而被授予瑞典央行(Sveriges Riksbank)经济科学奖的作品。其中几个与控制有着密切的联系:1978年和1986年的决策奖、1994年和2005年的博弈论奖、1997年的衍生品评估奖、2004年的商业周期背后的驱动力奖以及1969年、1980年、1989年和2003年的建模和时间序列分析奖。

经济学影响着我们所有人,需要我们的关注,经济学家很长一段时间以来都很清楚控制的作用(Kendrick, 1981)。然而,经济系统是一个庞大、复杂、全球性、分布式、动态的系统,有许多参与者、政府、银行、投资银行、公司和个人。政府控制法律和税收,中央银行设定利率和控制货币供应,公司和个人购买、出售和投资。不同的行动者有着截然不同的目标。行为经济学表明,个人决策可以基于情感和社会方面。该系统在商业周期中振荡,并且偶尔会出现危机,这显然指向控制问题。

获得2008年经济学奖的克鲁格曼在他的书中说(克鲁格曼, 2008):

“我们有磁故障(magnetotrouble),”大萧条开始时约翰·梅纳德·凯恩斯说。大部分经济引擎状况良好,但金融系统这一关键组成部分却不起作用。他还说:“我们卷入了一场巨大的混乱,在一台精密机器的控制下犯了错误,而我们不理解它的工作方式。”这两种说法现在和当时一样正确。

将这一点与Wilbur Wright在第2.5节中关于飞机平衡和操纵困难的引用进行比较,很明显,主要经济学家认识到经济中存在严重的控制问题。

6 理论与应用的相互作用

反馈控制在许多应用领域都起到了关键作用,事实上它几乎涉及到了现代社会的一切方面。控制理论同样是一个很深的领域,它运用了广泛的数学知识,有时甚至促进了数学方面某些领域的发展。这里人们可能会问,如此广泛的应用和如此深刻的理论是如何产生的,正如本文所述,答案丰富多彩。

控制系统需要使能技术才能实现。这些技术的应用和发展(有时是革命性的进步),在控制的进化过程中发挥了关键作用。此外,它们有时也发挥另外一个重要作用,那就是激励那些能带来重大社会影响的具有挑战性的应用,比如政府和工业界方面,使得他们乐意投资,用于控制技术和理论的发展。现代研究型大学体系的建立与完善,加上系统性的研究扶持,对学术研究的促进也起到了关键作用。当然,具有远见卓识的人物和深入研究者也功不可没。

这一领域的发展并不顺利,在长期的实践和理论发展过程中,有几次契合与启动积累了大量的成果。“理论与应用的差距”是一个动态的过程,它在社会上经常引起争议。在 1964 年的一篇细致入微的社论(Axelby, 1964)中,Axelby 提到:

当然,理论和应用之间应该保持一定的差距,因为没有它就没有进展。….看来,差距问题本身就是一个控制问题,必须通过适当的行动加以适当的识别和优化。

有一段时间,应用领先于理论,直到关键的理论突破才取得成功。在其他时候,这个间隙是反向的。理论的发展是以开环的方式进行的,没有来自现实世界应用的反馈,调查未来哪些可能是可行的,并提出想象的可能性,即使实现技术还不够成熟或完全理解限制。该领域既看到了理论的应用拉力,也看到了应用的理论推动。可以说,无论从哪个方向看,这种差距都是创造性张力的根源,最终导致了理论和应用的共同进步。

理解这些不同的相互作用,可以让我们了解工程研究和开发以及知识是如何相对于控制理论这一现代技术时代的关键支柱发展的。

有好几个时期,应用开发没有太多的理论依据。1933 年,过程控制领域的一位主要领袖伊万诺夫说(Bennett, 1979):

目前,温度自动调节的相关学科处于一种不寻常的地位,即在可忽略的理论基础上建造了一座巨大的实用性大厦。

即使在今天,PID 控制也非常成功;它是利用反馈力量达到目标的最简单的方法之一。在船舶操纵方面,修补匠斯佩里超越了理论家米诺斯基,如班纳特(1979)所述。早期飞行控制也出现了类似的情况(McRuer, Ashkenas & Graham, 1972):

.…在 1939-1945 年战争结束之前,他们似乎以最少的数学知识取得了进步。….在航空业大约 50 年的历史中,对飞机及其控制系统动力学的研究对那些学会了如何通过经验设计的工程师来说是微不足道的。…尽管如此,无人驾驶的稳定性和飞机对控制响应的数学理论是在早期发展起来的。非常幸运的是,战时的压力促进了两种发展,从根本上改变了自动飞行控制系统的设计技术。第一个是伺服机构理论:第二个是电子计算机。分析与仿真是当今飞机飞行控制系统设计的两大支柱。

几十年来,从离心式调速器的逐步发展过程中,可以清楚地看到涵盖从反馈应用到分析设计的广泛而深入的理论框架。早在 1745 年 5 月,使用离心式调速器制造的风车就已经投入运行,随后在 1780 年,瓦特设计的蒸汽机中,离心式调速器也得到应用,它最初是一个比例控制器,后来增加了积分和微分作用(Bennett, 1979 年)。大约一个世纪后,Vyshngradski(1876 )和 Maxwell(1868 )发起了一项理论研究。这带来了 Hurwitz(1895 年)和 Routh(1877 年)在稳定性分析方面的工作。

类似地,为了应对长途电话中继器的挑战,1927 年布莱克(1934)发明反馈放大器,尽管那时并没有理论依据。在缺乏基本理论理解的情况下,这是一项非常困难的技术。实验室遇到的不稳定问题促使博德和奈奎斯特发展了反馈放大器的理论(博德,1940;奈奎斯特,1932)。在这种情况下,还有一个非常重要的因素: 一个拥有研发实验室的巨头企业的存在:美国电话电报公司(AT&T)。布莱克、奈奎斯特和博德这三个都是其员工。这是一个典型的成功案例,在这种情况下,通过垄断,结合长期带来的足够资源和努力,来解决基础应用挑战。

另一个例子是火力控制的发展,最初该项目是为了海军作战,后来是为了防空火力。后者得到了Vannevar Bush领导下的美国政府一个项目的持续支持,并最终带来了伺服控制理论的发展,布什(Wildes & Lindgren, 1986)在麻省理工学院早期的电力系统网络研究中发现:

形式数学往往不足以解决许多迫切需要解决的问题,在缺乏全新数学知识的情况下,机械方案提供了最有前途和最有力的解决措施。

同样,冷战时期的半自动地面防空系统(SAGE)最终带来了对采样数据系统的研究;Ragazzini 和 Franklin(1958 )(第 3.1节)。后来,由于对推进飞行包线的要求更加严格,飞行控制导致了对多变量稳定裕度的研究,即鲁棒性(Safonov & Fan, 1997)(第 4.13 节)。最近,设计安全可靠的嵌入式系统(例如汽车嵌入式系统)的需求正在推动基于模型的开发、验证和验证工作。

模型预测控制的发展是另一个有趣的例子,在这种情况下,理论和实践之间的相互作用具有一定的偶然性。Richalet、Rault、Testud 和 Papon(1978)计算出最佳轨迹,但仅使用其初始部分,然后在每个样本后重新计算轨迹,在离散时间设置中解决了一系列实际问题。这一过程被称为“滚动时域控制(receding horizon control)”;

Kwon 和Pearson(1977)也对其进行了研究。后来,两名化学工程师查理·卡特勒和布莱恩·拉马克经营着处于罢工的一家炼油厂时,遇到了一个关键问题:在一次等级更改期间必须设置几个控制变量。Cutler 和 Ramaker 通过实验首先确定稳态增益来解决这个问题。基于所需的输出变化,通过矩阵反演获得控制措施的适当变化。为了更快地做出改变,他们测量了多变量脉冲响应,并计算了一组未来的控制措施,这些控制措施将根据期望的轨迹改变状态。他们应用了第一个控制信号,并重复了程序。他们并不精通控制理论,将脉冲响应称为“动态矩阵”,设计过程称为动态矩阵控制(DMC)(Cutler & Ramaker, 1980; Prett, Ramaker & Cutler, 1982)。罢工结束后,卡特勒和拉马克重新开始研发,并开始改进这种方法。他们赞助了相关研究,并在壳牌公司安排了研讨会,与学术界互动(Prett, Garc_a & Ramaker, 1990; Prett & Morari, 1987),后者反过来发起了稳定性和鲁棒性研究(Bemporad, Morari, Dua & Estratios, 2002; Garcia, Prett & Morari, 1989; Mayne, 2000; Morari & Lee, 1999)。

另一方面,在20世纪下半叶,控制理论研究蓬勃发展,这是一个很长的时期,当数字计算机引入反馈回路时,它立刻引发了平台革命。显然,这种新式控制器需要一种与频域理论(虽然它非常适合用于反馈放大器)不同的新式控制理论,也就是状态空间理论,事实上,在卡尔曼的论文(Kalman, 1961a),他声称“ 这篇论文开创了纯控制理论的研究”。状态空间理论立即得到了应用。Swerling 将他的滤波器(Swerling, 1959)用于地面测量卫星轨迹估计(Grewal 和 Andrews,2010 年),美国宇航局艾姆斯研究中心的 S.F.Schmidt将 Kalman 滤波器(Kalman, 1960)应用于绕月导航问题,并将其开发用于阿波罗米西奥号的实时机载导航。N(Grewal & Andrews, 2010)。从 1960年开始,近 40 年来,状态空间理论的发展成为学术界一个非常活跃的研究课题。所罗门·列夫切茨(Solomon Lefschetz)于1957年开始领导的高等研究所(RIAS)数学和控制小组发挥了重要作用,该中心成立于 1955 年,旨在开展与苏联类似的工作(Grewal & Andrews, 2010)。控制研究人员致力于研究线性微分/差分方程,建模线性系统,甚至更广泛地研究随机系统、非线性系统、分散系统和分布参数系统。这得益于美国政府为大学研究人员提供的资金充足的研究项目,这是Vannevar Bush战时在国防研究和发展方面的成果,以及随后在美国创建国家科学基金会的倡导。基于模型系统的丰富理论开始出现,出现了一些重要的应用,如系统辨识和自适应控制。这在过程控制中尤其如此,那里有着丰富的实验传统。

当时的理论在某些方面领先于技术发展,许多探索性的想法不能实现,必须等待强力的计算、网络技术等的发展。理论探讨了一些可行范围,无论是结果解的无限维性,还是动态规划的维数性的诅咒,或更广泛地说,解决方案或者其实现的复杂性。例如,研究了一类非线性滤波问题,其中最优解是有限维的。这样的努力在校准什么是可行的,什么本身是重要的(信息论)是有价值的,即使它们没有导致重大应用。

然而,先前表明显式解的极限的理论在计算能力大大增加之后的几十年中被重新审视,部分观测系统的控制就是一个例子,它现在是机器学习和人工智能的主要手段之一(Shani, 2013)。

出于上述原因,理论研究的这段极其丰富的时期也导致控制理论以“ 开环”的方式发展,而没有来自现实应用的可以对其进行测试的持续反馈,因此。理论和现实的测试之间存在时间差距,主要由于在某些情况下,实现技术还不成熟。一些重要的缺点只有理论在实际应用得到验证后才被发现。例如,线性二次高斯控制(Doyle, 1978)缺乏多变量稳定裕度,这是在潜艇模拟试验中发现的(Safonov & Fan, 1997)。事实上,模型不确定性的鲁棒性是早期基于模型的状态空间理论的主要缺点之一。这一点在自适应控制中也是正确的,当拟合参数的模型类不包含真正的系统时,(Rohrs. Valavani, Athans & Stein, 1981),导致了“鲁棒”自适应控制的疯狂活动。最终形成了一个包含模型不确定性的理论,最终在一篇获得了 IEEE W.R.G.Baker 奖(Doyle, 1989)的论文中得出了结论。

在控制理论研究的黄金时代,控制在学术界逐渐具有了牢固地位。大量的理论研究人员对许多领域进行了深入的研究,这有助于形成一个强有力的理论。伯克利的一篇论文(Bergbreiter, 2005)题为“ 从实践到理论的转变:二战后的自动控制(“Moving from Practice to Theory: Automatic Control after World War II)”,详细描述了这种现象。不可避免地,有一种对艺术的态度。有时候,很多人还致力于解决一些不太重要的问题,忘记或忽略冯·诺依曼(1947)的话:

我认为,数学思想源于经验主义,这是一个相对较好的接近真理的方法——它太复杂了,除了近似法以外什么都不允许。但是,一旦他们被构想出来,主体就开始过自己独特的生活,并且是这样的。…几乎完全受美学动机支配。换言之,在距离经验来源很远的地方,或者在经历了许多“抽象”的近亲繁殖之后,数学学科就有退化的危险。在我看来,无论何时达到这一阶段,唯一的补救办法似乎就是回归本源:回归或多或少直接的经验观点。…

当然,影响控制演进的一个重要因素是技术的可用性。虽然数字计算机确实引发了一场革命,但最初的计算能力是有限的,而且没有任何明显的数据网络。因此,在那个时代的许多方面,如上文所述, 理论研究主导了技术,随着技术的可能性和局限性越发清晰,自然需要进行过程修正。然而,随着摩尔定律四十年来不断实现的微电子革命,富有想象力的研究使得该领域处于一种良好的创造性状态,以寻求在计算能力、软件、数据网络、传感器和执行器等领域的革命之后开辟出来的新机遇。

我们不可能列出控制的全部应用;粗略的随机抽样得出以下结果:过程控制、电话、移动电话、电力系统、飞机和航天器、互联网、燃油喷射的计算机控制、排放控制、巡航控制、汽车制动和驾驶室舒适性、生产和库存控制、导弹制导、机器人、电器、半导体晶圆厂、主动噪声消除、自动高速公路、原子力显微镜,量子控制,质谱,大空间结构。目前,几乎所有的技术都以反馈控制为核心。作为一个例子,最近一篇文章(Perry, 2013)描述了最新的 IEEE荣誉勋章获得者、高通公司联合创始人 Irwin Jacobs 的努力,其中提到:

…他设想了一个快速响应系统:CDMA 手机将监测从发射塔传来的信号的功率;如果信号突然下降,比如,当用户走进大楼时,手机将启动其发射信号,并推测如果听到发射塔的声音有问题,发射塔将听不到电话。接下来,CDMA 发射塔的设备将获取少量接收比特,并计算出平均信号强度;如果该信号低于或高于预设阈值,则发射塔将提示手机降低或提高其功率。…“其他人可能已经研究了所有的复杂性和关注点,并得出结论,这是不可能的”。

控制,无处不在,这句话并不是空穴来风,它被称为幕后技术。

除了工程和技术,反馈和前馈在其他领域也有很多用途。在经济学中,中央计划可以被视为一个前馈的例子,而市场经济可以被视为一个反馈的例子。早在1953年,塔斯汀就写了一本关于经济控制的书(塔斯汀, 1953)。至少在技术系统中,反馈和前馈相结合可以得到最好的结果。控制也进入了不寻常的领域,如互联网广告和艺术。

然后是生物学,也许是在革命的边缘,在那里,解开和利用无所不在的反馈过程是人类的梦想。

在上述所有进展的基础上,为大系统建设打下了基础。二十一世纪很可能是一个大系统建设的时代。我们不仅在能源或水资源方面遇到了资源和环境限制,同时我们也面临着来自全球大部分地区的现代交通、能源、水、卫生保健服务等巨大需求,而这些地区以前没有获得这些服务。全球范围内的主要努力都是针对智能电网、自动化交通、医疗保健等方面的巨大挑战,对于这一切,传感和驱动,关键都在控制。

7 结束语

控制是一个具有多个独特特性的领域。它的进化是现代技术世界历史的真实缩影。它提供了人、项目、技术和研究的迷人互动。控制超越了航空、化学、民用、电气、工业、机械和核工程等传统工程领域的界限。它的发展不是由一个单独的技术领域引起的,而是由几个技术项目引起的,在其发展的不同时期有着不同的项目推动,如消防、电话、电力系统、飞行控制、空间探索和机器人技术。控制也对一些非工程领域产生了影响,如生物学、经济学、医学和物理学。控制的概念和想法在各个领域之间迁移。

控制的发展大大得益于几个重大挑战,如跨大陆的电话、火力控制和载人登月。它的发展也得益于垄断行业和政府的集中力量。它还得益于二战后学术研究的繁荣。

不同的应用领域强调了控制的不同方面,从而形成了一个丰富的控制框架。反过来,在许多情况下,控制的发展从根本上影响了这些领域的发展。

控制是第一个系统学科。它能够认识到许多工程问题的共性。系统观点——通过操纵输入使“工厂”或实体的输出以理想的方式运行——是一个统一的观点,无论应用领域如何,都能为设计过程提供非常清晰的信息。

实现的赋能技术对控制设计技术和基础理论的发展产生了重大影响,这一点可以从模拟计算时代频域理论的发展以及后来数字通信时代的状态空间方法和多级决策的发展中看出。

控制是一个领域,其进展的不同阶段可以用几个关键理论贡献所划分。这些涉及到各种数学子学科,如复分析、微分方程、概率论、微分几何、优化和图论。因此, 控制是目前工程中数学化程度最高的领域之一

在这一领域的研究成果总结成了非常丰富的涵盖几个子领域的高级和专门书籍。范围包括自适应控制、经典控制、离散事件系统、微分博弈、数字控制、分布参数系统、动态规划、估计、辨识、线性系统、多变量控制、网络系统、非线性系统、最优控制、鲁棒控制、滑模控制、稳定性、随机性。集成电路控制。甚至还有专门的控制百科全书。

控制已经成为许多现代技术的核心组成部分,即使它常常被隐藏在视线之外。

事实上,很难想象任何处理不涉及控制的动态现象的技术。理论与实践之间存在着动态的差距。有时,应用程序主要由修补组成。有时正是实践中遇到的严重困难导致了理论上的重大突破,这在实践中极为相关和重要;博德和奈奎斯特的工作就是一个例子。

另一些时候,初期的技术可能性开辟了理论研究的新领域。这导致了对系统理论概念的广泛探索,如稳定性、可控性、信息结构、最优性、复杂性和鲁棒性。有时,这种探索是在没有实际应用反馈的情况下以开环的方式发展的,有时是作为一种数学努力。在某些情况下,技术还不成熟,无法实现和测试正在探索的一些概念。

我们现在在哪里  我们可以从历史中学到什么?过去如何为未来提供一些指导和反馈?我们提出我们自己的观点。

在技术方面,随着传感器、执行器、网络、计算硬件和软件的飞速发展,部署和实施大型复杂系统已成为可能。随着实施能力的显著增强,理论与实践之间的差距需要缩小。这可能需要在在一方面进行更多的理论探索来解决应用程序中遇到的困难,同时进行更多的实验来确定困难是什么,从而确定需要解决的问题。

一方面,如果问题得到了很好的理解,就需要有强有力的理论努力来制定解决方案。一个例子是对形式方法的需求。一个好的理论可以避免大规模的基于仿真的测试的需要,这在成本和时间上都非常昂贵。复杂系统的设计、实现、维护和升级,如果没有从需求到最终产品的所有正式方法,就无法安全地完成。

另一方面,需要进行更大的实验,以了解瓶颈是什么,校准已有的解决方案,并了解什么有效或改进了性能,什么没有效。一个例子是构建自治系统的目标,在这个目标中,不确定度或模型类的先验分布还没有被很好地理解。在这种情况下进行实验对于了解真实世界很重要,而且是有启发性的。它可以引出一个相关的理论。

实验不同于演示。实验涉及理论或模型与实践之间的双向动态交互,即反馈回路。另一方面,演示只是证明某个特定的解决方案可以按要求执行。它们不是实验或真正实验室的替代品。

对于研究来说,重要的是调查应用程序,在它们的指导下,通过什么有效,什么无效。了解性能、鲁棒性、可靠性的真正瓶颈是什么,以及如何缩短设计和部署周期是很重要的。

控制系统研究人员应承担全部系统责任。事实上,正如历史所表明的,例如在反馈放大器的情况下,对真正问题的认识本身就是一项重大的研究成果。这样的认识可以导致对实践产生深刻影响的相关进展。

教育也需要发挥重要作用。该领域应培养能够解决从概念设计到实施和调试整个问题的学生。由于控制、通信和计算的融合,学生还需要在所有这些领域以及数学的广泛领域内具备知识。我们还必须给学生们留出空间,让他们掌握生物学等领域的知识,在这些领域进步非常迅速。如何在本科课程的有限时间内完成所有这些要求进行彻底的检查。在研究生阶段,人们还面临着深度的额外挑战,因为这对研究至关重要,事实上,这是该领域的一个重要力量。

写作总结有着重要的作用。过去 70 年的巨大研究成果必须用事后的眼光提炼成紧凑的书籍。我们需要压缩现有的知识,强调基础。这需要在本科和研究生两个层次上完成。

在控制如何分散在多个工程部门方面也存在挑战。由于工科教育和研究是从采矿、筑路筑坝、机械建造、发电和输电、化学工业应用等特定技术发展起来的,它导致了一个以采矿、土木工程、机械工程系为基础的工科学校的组织。电气工程、化学工程等。这在 19 世纪末和 20 世纪初非常有用。 但是,这是否是二十一世纪教授越来越强大的系统学科的最佳结构,比如跨越这些领域的控制?

由于存在着许多巨大的挑战,控制领域有着光明的前景。全球对先进的交通、医疗、能源、水等系统有着巨大的需求,这些系统必须在资源有限的环境中进行设计。生物学是另一个重要的控制研究领域。二十一世纪很可能是大系统建设的时代。