英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
居住建筑的能耗性能的预测:遗传编程算法
摘要
在当今的经济下,一直强调一个重要的政策问题——能源消费。尤其是住宅建筑的能源效率被认为是一个国家的能源政策的重中之重。本文提出了估算住宅建筑的节能性能遗传编程基础框架。该框架的目标是建立能够预测热负荷和住宅建筑的冷负荷的模型。这些参数的准确预测有利于能耗的更好的控制,并且它可以帮助选择出对应能源需求的设备,这被认为是在放松管制的能源市场的重要问题。该框架融合了最近开发的遗传算法的版本,本地搜索方法和线性缩放。由此产生的系统使我们能够建立一个经过双重参数考虑过的的精确估计的模型。在768座多元住宅中,大量的模拟证实了该方法的预测热负荷和冷却负荷的适用性。特别是该方法比现有的国家的最先进的技术更准确。
关键字:能源消费 热负荷 冷负荷 遗传编程 机器改进
1. 介绍
在今天的经济体中,建筑能耗的问题已经越来越热门。由于建筑所代表的能源大量消费者遍及世界各地和生活水平的不断提高这一趋势增长,在过去的几十年里,这个问题在不同利益相关者(如居民,政策制定者,行业)中已经引起了相当的关注。据报道[1],1994年至2004年,在欧洲和北美的建筑能耗已经分别以每年1.5%和1.9%的速度提高。在中国能源市场这个增长率更大,在过去20年里,建筑能耗已经以每年超过10%增加[2]。建筑高能耗与建筑节能需求的稳步增长需要节能建筑的设计和其能源性能的改进。另一个重要方面是能源消耗持续增加对环境的影响。根据联合国环境计划署(UNEP)[3] 的报告,建筑使用全球能源的40%,全球水资源的25%和全球资源的40%。在许多国家,真正危险是随着全球变暖和气候变化的后果(包括空调日益增长的依赖),能源需求和二氧化碳排放量将进一步增加[4]。在努力减少建筑能耗对环境的影响,欧盟最近通过了一项指令(欧盟指令2002/91 / EC [5]),要求欧洲国家必须要符合能效适当的最低要求。
对于住宅,能耗的最大部分是由于我们说的供暖,通风和空调(HVAC)系统的使用。正如报道[6],有一种减轻对额外的能量供应的日益增加的需求的方式是建设更多的改进了节能特性的的节能型住宅。确保正确的HVAC系统被安装在建筑物不仅用于为家庭提供室内的舒适度,同时也为节省那些被过大或者过小的系统浪费的能量。消费者和设计者应具有近似区域的HVAC设备的给定片在理想的条件下可能被预期升温或冷却的想法。为此目的,设置正确估计的热负荷(HL)和冷负荷(CL)以实现有效的用于建筑物的暖通空调设计显得尤为重要。热负荷是要被添加的空间中的那部分热能,冷负荷是要被从空间中去除的那部分热能,它们是用以保持温度在可接受的范围内。热负荷和冷负荷也被统称为负荷,考虑到建筑的围护结构(包括地面,墙壁,天花板和屋顶)和建筑物的窗户玻璃和吊顶灯(基于型号,性能,明暗以及灯罩)。 热负荷和冷负荷的可靠的估计是极为重要的,并且可能对经济造成严重影响,因为在这些估计错误可能意味着能源的浪费。然而,准确预测热负荷和冷负荷是一个困难的任务。大多数HVAC设计时下仍然基于HVAC的专业人员,其中有一个主观成分,因此可能会有错误的个人意见。在这样一个角度来看,我们迫切需求一个用于精确地估计热负荷和冷负荷的可靠计算工具,这是现在工作的重心。
如在[1]中的讨论,在设计节能建筑的过程中的重点是建筑师,工程师和设计师需要确定哪些参数将显著影响未来的能源需求。这些参数的确定后,建筑师和建筑设计人员通常需要用简单可靠的方法快速评估建筑的节能性能,使他们能够优化设计方案。近年来,几种方法已经被提出用于模拟建筑物的能源需求。所提出的方法的范围从传统的回归方法[7,8]到更复杂的机器学习技术,例如人工神经网络(人工神经网络)[9-11]。虽然所提出的技术表现出了良好的效果,它们目前展现出的问题经常使设计师和建筑师无法使用它们。例如,神经网络模型的性能强烈地依赖来自网络的体系结构,这通常是在一个特定的和手动方式进行的设计。
在本文中,我们提出了一个通过机器学习框架来预测一套大住宅的热负荷和冷负荷。在该框架中,使用包含如下八个变量的数据(相对密度,表面积,壁面积,屋顶面积,总高度,方向,玻璃面积,玻璃分布),构建预测模型(对热负荷及冷负荷进行预测);用于评估该方法的性能的数据集与[6]的数据集是相同的。尽管在[6]中提到的方法代表着国家对建筑能耗最先进的预测技术,但也有可能研发出一套能有更好表现的(能耗预测)系统。(我们/本论文/本研究)设计的方法将在最新的遗传编程技术上进行突破,将已实现了搜索过程中进行语义识别的遗传编程方法,与本地搜索方法和线性缩放技术的变体进行结合。
接下来本文将按如下结构展开论述:第二节将对标准的遗传编程技术进行概述,并解释它如何用于解决符号回归问题;第三节将介绍几何语义遗传编程算法在本项工作中是如何运行的;第四节和第五节将分别对局部搜索方法和线性扩展技术进行介绍;第六节将描述本次研究中使用数据集、实验设置和具体的数据分析结果,并据此对研究所设计的系统和其他现有技术方法进行了比较;最后,第七节将对本次研究以及研究意义进行总结。
2. 遗传编程技术
遗传编程(GP)[12]是一项属于智能计算研究领域,又称进化计算的计算方法。受到生物进化过程的启发,GP是计算机程序自我学习的过程。通过一轮又一轮运算,GP随机地将部分原有的计算机程序进行更新;使用目标函数(适应性函数)对一项方案的质量进行描述, GP的搜索过程的函数图像则如图1所示。
为了将一组候选解转化为新的候选解,GP将使用特定的搜索算子(又叫做遗传算子)进行运算。以公共树的表述方式理解GP[12],不同的形态和结构公共树则代表着不同的候选解,而公共树结构的差异正是由标准遗传算子(包括交叉的和变异的)所决定的。换而言之,标准遗传算子即是程序的语法。在本文中,我们使用的遗传算子与标准遗传算子有所不同,它将能够在语义层面进行运算;而本研究中对“语义”的定义[13]将在下一节中进行讨论。
然而,为了能更好的理解本文中使用的遗传算子与一般遗传算子的差异,本文将在此对标准GP算法中使用的遗传算子进行简要描述。标准交叉算子一般通过将母体一部分遗传物质和另一个母体进行交换,从而对两个母体进行融合。具体而言,在基于二者适应性选择了两个个体作为母本后,交叉算子将随机从两个母本中各自选择一部分在二者间进行交换。变异遗传算子则作用在种群结构的随机变化中。传统的、最常用的变异算子,又称作子树突变则随机选择公共树的某一点,删除这一点上其他的子树,并在这一点上随机生成、插入新的子树。这一过程是由给定参数所控制的,这一参数决定了变异遗传算子生成的新子树的最大值(一般用树深进行测量)。
2.1. 遗传编程中的符号回归
在符号回归中,回归的目的是为了寻找最能拟合特定测试集T = {(x1 , t1 ), . . ., (xn , tn )}的符号表述TO : Rp→R,其中输入变量xiisin;Rp,输出结果tiisin;R;一般符号回归问题可被定义为:
其中,G表示由初始设定P(函数和终端)所定义的解空间,函数f是一个基于程序的输出结果T(xi , ?)和期望输出(或目标输出)ti之间差距(或误差)的适应度函数;?是假定m为实际参数时,对T的符号表述的一个特定化参数表达。
在标准的遗传标准中,由于遗传编程的搜索算子通常只关注语法,因此参数的最优化通常不是十分明显;此外,这些参数在编程中通常只作为隐含条件进行考虑。但是,近期的研究已经开始着手解决这一问题;例如,一个非线性数值算法[14]被用于调整(GP)进化程序的参数化过程,并在改善算法的收敛速度和求解质量上取得了实质性的成果。尽管已有文献已包含了对标准遗传编程搜索的参数优化[14],本文将把这一思想应用到遗传编程的一个新变体中——几何语义遗传编程(GSGP)。
3. 几何语义算子
尽管通过遗传编程技术,人类社会已取得了许多有竞争价值的研究成果;研究者们仍然坚持于探索新的方法以改善遗传编程的性能和功率优化。近年来,一个新兴的理念便是在遗传编程的进化过程中进行语义识别。虽然现有的研究中[16,17]对语义的概念界定并不一致,且语义的概念可以用不同的表述方式、通过不同的视角进行解释;在本文中,我们将采纳在现有遗传编程相关文献中最为广泛使用的定义[13],即:一个程序的语义Ti,是在一组测试数据集T上执行该程序(或候选解)后,获得输出结果的向量si = [Ti (x1), Ti(x2), hellip;hellip;, Ti(xn)]。[13]
虽然程序的语义决定了程序的实际操作,但传统的遗传编码算子在操作程序时只会考虑它们的语法;此外,传统的遗传编码忽略了语义所规定的程序行为的相关信息。这一选择的后果便是导致我们很难(甚至无法)预测对语法的调整,将会对程序的语义带来怎样的影响。为了突破传统遗传编码的这一局限性,最近提出了能够在程序的语义上运行的新遗传算子。[13].
我们考虑到一个典型的GP问题:找到一个能把输入的数据映射到已知的目标输出的函数(如我们说,回归和分类是特定的情况下)。对于这个问题的适用性通常我们会检测其预测输出值与预期值的差距,即,误差测量。在这个意义上说,最佳的解决方案将等于零误差;即最优解或目标方。,语义是预期的输出值T = [T 1,T 2,hellip; ,T N]的载体。因此,该搜索应该向一个单一的全局最优解的方向进展[19]。几何语义算子限定在具有对产生的后代的语义精确后果的语法变换。例如,子代保证具有所包含的父代的语义的局部邻域内的语义。几何语义算子被证明能够在任何问题上从某一方面[19]找到一组输入数据与一组预期目标之间的联系。在本文中,我们将考虑几何语义算子在真实函数中的定义,因为这些都是算子,我们将在实验阶段使用。特别是,几何语义交叉(GSC)生成的表达
作为母体T 1,T2: R N→R唯一的后代,其中T R是随机实函数的输出值,范围在区间[0,1]。类似地,几何语义突变(GSM)返回表达式
作为个体T:R N→R的突变的结果,其中T R 1和T R2是具有值域[0,1]的随机实函数,毫秒是突变步骤的单位。
Moraglio等人[13]指出,GSC对应几何交叉在语义空间(即后代的表现代表着部分母体的表现的观点)和GSM对应球突变的语义空间(从而诱导某一独立适应点)。Moraglio等指出,这些算子创造出比他们的母体要大得多的后代,在群体中发展的最快的个体迅速使得适当的估计变得不能忍受的缓慢。在[20,21],一个可能解决此问题的方法被提出,包括Moraglio的算子的应用,使他们不仅可用在实践中,也非常有效。该应用是基于除了存储所述初始树,在每一代它有足够的内存去维护,每个个体的语义都参考其母体。正如所示[20],进化一个含有n个个体的群体g次的计算成本为O(ng),而评估一个新的,没有见过的实例的成本是O(g)。
从现在起使用几何语义算子产生新的候选解决方案的GP算法将会被称为几何语义GP(GSGP)。 GSGP可通过交叉和变异的方式使用一系列递增的方式来建立任意近似函数。与此相反,例如,用众所周知的多层感知器(MLP),采用一个整体的方法,其中一般解决办法的形式(网络拓扑)被定义为先验的,学习算法有优化的目标内部连接的权重。这基本上是一个从局部最优逐步改善的自下而上的方法(GSGP)和自上而下的全球方法(MLP)之间的差异。当然也可以增量的方式来建立MLPS,如流行的NEAT算法[22],但这些方法的比较和分析超出了本文的讨论范围。
4. 在几何语义算子中的本地搜索
在这个讨论中,我们用GSGP整合了一个本地搜索(LS)的策略。特别是我们在GSM变异算子中加入了一个本地搜索器,因为以前的工作已经表明,GSGP在仅使用突变中通常达到其最佳性能[23]。树T含有带有本地搜索的GSM(GSM-LS)产生一个个体:
其中alpha;iisin;R,alpha;2替换公式中在Eq. (3)中定义的变异步骤参数ms。这实际上定义了一个可以被解决的基本多元线性回归问题,例如,通过最小二乘回归(OLS)。然而,在这种情况下,我们有n个合适的线性方程组,只有三个未知数(alpha;1,alpha;2和alpha;3)。这给出了一个超定多元线性拟合问题,这可以通过SVD1来解决。我们认为这应被视为一个试图确定父树和用于干扰的随机树的最佳线性组合LS算子。在此背景下,本地术语应该使用在由GSM算子带来的线性问题。在某种意义上,该方法要优于以前依靠非线性局部优化的工作[14],因为线性假设大多不满足与标准GP和相应的参数化的表达式。另一方面,在这种新的方法是简单的应用线性回归优化的,因为该GSM算子定义了参数空间中的线性表达。
包含一个本地搜索方法的思想是基于几何语义算子的性质的一个非常简单的发现:当这些算子相对于标准的算子表现出良好的性能的时候,它们需要大量世代的会聚来得到最优解。包括本地搜索的方法,我们期望提高搜索算法的收敛速度。
5. 线性缩放
在[24]中首次介绍使用线性缩放来改善GP在象征性的回归,使用GP个体编码的公式计算斜率和截距来修改合适的函数。鉴于Y i= T(X i)为输入值X I对应的个体T的 GP的输出值,线性缩放计算为下列表达式:
其中m是适合的例子的数目(即,在实验设置的例子的数目)[25],macr;y和macr;t分别表示的平均输出值和平均目标值。这些表达式分别计算一组输出值y的斜率和截距,使得t和a by之间的平方差的总和最小。在这之后,任何误差测量可以用缩放公式a by来计算,比如均方根误差(RMSE):
如果a不为0且b不为1,上面叙述的步骤是保证简化的RMSE可以使用到任何公式y= T(X I)中[24]。在本文所讨论的所有实验中,a和b一直只使用试验数据计算。然后,a和b的数值已被用来计算没出现过的测试数据、重新缩放的RMSE。在这种情况下,计算所述斜率和截距的要求是训练集的类型是线性的。通过有效地计算每个个体的斜率和截距,搜索a和b的需要被
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[151545],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。