明确改革方向 让数据发挥作用——AI技术助力新清单计价标准落地实施(一)
一个质量合格、安全可控的工程项目背后,必然有一个合理的造价作为支撑。建设工程造价数据具有结构清晰、逻辑严谨、参考度高的特点,具备极高的积累与应用价值。利用建设工程历史交易过程产生的数据代替定额编制、管控工程造价行为,已成为行业共识。
建设工程造价数据积累是造价市场化改革的支撑。2020年,住房城乡建设部办公厅印发《工程造价改革工作方案的通知》明确指出:“要坚持市场在资源配置中起决定性作用,正确处理政府与市场的关系,取消最高投标限价按定额计价的规定,逐步停止发布预算定额;同时要加快建立国有资金投资的工程造价数据库,按地区、工程类型、建筑结构等分类发布人工、材料、项目等造价指标指数,利用大数据、人工智能等信息化技术为概预算编制提供依据”。
由此可见,取消“定额”后,如何支撑工程造价概预算编制,国家已给出明确方向:即利用市场鲜活的招标造价数据、合同价数据、结算价数据,借助信息化、人工智能手段,实现工程造价市场形成机制,推行“清单计量、市场询价、自主报价、竞争定价”的工程计价方式,真正落实市场在资源配置中的决定性作用。
过往历史数据多以“定额”为编制依据,这些收集到的历史数据是否能代表“市场”真实水平?
实际上,早在2003年第一版工程量清单计价规范实施之初,行业主管部门便已提出“参考量、市场价”的要求——各级造价管理机构发布的“定额”,仅在编制招标控制价时需严格遵照执行,企业投标报价可结合自身情况进行调整。从国家建设工程造价监测平台收录的68万余个建设项目造价数据来看,大部分工程造价数据都对定额的人、材、机含量进行了针对性调整。
由此可见,在现有的招投标规则及评标办法下,甲乙双方在招投标过程中所形成的合同价、竣工结算价,是甲乙双方真实意愿的体现,既反映了建设工程市场的竞争态势,也呈现了市场的真实水平。
工程造价数据是建筑行业少有的结构化数据,具有逻辑性强、更新速度快、同类工程参考度高、积累应用价值大等显著特点。我国每年有数十万亿元固定资产投资,工程建设过程中产生了大量宝贵的工程造价数据,涵盖投资估算、设计概算、最高投标限价、投标报价、合同价、结算价等。这些数据结合地区、时间、工程类型属性,针对同类工程项目具有极强的参考性。
然而,受限于缺乏统一规划和管理,这些数据格式不统一、形式多样,分散在不同单位,未能形成可高效复用的数据资产。究其原因,造价数据成果文件都是由造价软件编制生成。据不完全统计,建筑行业从事造价软件研发的企业有50余家,不同的软件公司产生的数据文件格式不一致,无法实现相互打开,制约了数据的规模化积累与深度加工。
推动历史造价数据有效积累与应用,不仅是推进建设工程造价改革的关键抓手,也是推动新版清单计价标准落地实施的重要手段,同时可以有效解决当前建筑行业面临的诸多痛点。具体而言,其应用价值体现在三个方面:
其一,将历史数据利用人工智能、大数据技术进行整理、分析和挖掘,提炼形成按地区、按时段、按类型、分层级的建设工程造价指标、指数,可以为建筑行业相关从业人员、造价管理机构、政府监管部门提供服务,支持编制最高投标限价和投标报价,助力建设单位开展“清标”工作,为财政审计部门开展工程项目审计提供数据依据。
其二,市场监管部门可以据此发现恶意抬高价格或恶意低价中标等扰乱市场的行为,维护公平公正的市场竞争环境。
其三,结合建设工程质量、安全的数据,可以找到工程造价与建设工程质量、安全之间的关联关系,推动“两场联动”。
总体而言,通过对既有建设工程造价数据的深度分析,能够让工程造价精准反映供求关系、企业实际生产效率,营造公平、公正、公开的市场营商环境,让市场充分发挥资源配置的决定性作用。
建立行业标准 有效积累数据——AI技术助力新清单计价标准落地实施(二)
标准化是信息化的重要基础,要有效积累工程造价数据,就需要建立相应的标准。为此,在工程造价信息化初期,就有了标准体系,其涵盖四个数据维度——用于数据标识的标准,如《建设工程人工材料设备机械数据标准》;规范数据格式的标准,如《建设工程造价数据交换标准》;统一数据分类的标准,如各类型工程的《特征分类与描述标准》;明确数据加工计算的标准,如《建设工程指标指数分类与测算标准》。这些标准有效保证了工程造价数据可积累、可加工、可对比、可应用。
建设工程人工材料设备机械数据标准:夯实数据根基
人工、材料、施工机具的费用是建设工程造价的核心构成,造价数据最小的单元就是工、料、机的含量和相应的单价。然而,对人工、材料、施工机具的描述,在不同的数据文件中存在显著差异,比如有的叫“混凝土”,有的叫“砼”。材料本身的属性定义描述也不尽相同,比如,有的叫“C30”,有的叫“强度30”。这种碎片化数据形态,不管是用来对比,还是用来汇总分析都存在困难;由于建筑工程用到的人工、材料、施工机具的种类基本具有可穷举性,所以有必要将建设工程的人工、材料、施工机具统一编码,实现唯一标识。这样,构成数据的基本单元就会清晰准确,实现可积累、可对比。
建设工程造价数据交换标准:打破数据壁垒
我国建筑工程造价软件研发领域聚集了50余家企业,各软件生成的数据格式自成体系,导致了不同软件之间无法互通,更无法实现数据的有效积累与应用。当前,为实现电子招投标,各地区出台了一系列地方造价数据标准,实现了本地区数据格式的统一,但在客观上形成了更大范围的“数据孤岛”,同时也造成了建筑行业的一大“怪象”——每个施工单位都有若干把“软件加密锁”,因为在不同地区投标都需要购买符合当地数据标准的软件,这不仅给施工单位带来了巨大的成本负担,也阻碍了国家统一大市场的建设。
针对以上问题,住房城乡建设部标准定额司启动编制《建设工程造价数据交换标准》,旨在实现建设工程造价数据成果文件全国范围内的格式统一,从而在满足电子招投标数据上传的要求的同时,能有效支撑建设工程造价数据的积累与应用。
各类工程特征分类与描述标准:实现工程特征标识
建设工程造价数据的高价值,核心体现在“同类数据的强参考性”。比如同一地区的剪力墙住宅楼,都是带有电梯的塔式住宅,在外墙做法、内墙做法、楼地面、门窗等主要工程做法一致的情况下,其工程造价数据的构成是一致的,单位造价水平是相近的。这些工程的造价数据成果文件,就具有可参考性。这就需要在工程造价数据文件上赋予特征信息的标签。但工程特征信息维度多元,不同的维度有着不同的定义,需要有统一的描述标准。否则,有的地方按照高层、小高层、多层划分,有的地方按照砖混、框架、剪力墙划分,不同地区之间积累形成的造价数据也就没有了可对比性和可参考性。
为此,住房城乡建设部标准定额司组织编制系列《建设工程特征分类与描述标准》。以房屋建筑工程专业为例,在编标准共包括十大分部、数十个子分部及800个左右的分项,每一个分项都有相应的特征,全部描述不现实也没有必要,编制组按照“抓大放小”的原则,在大数据技术的支持下,聚集对影响造价大的特征项,分析其特征值并为其赋予相应的编码,致力解决工程特征信息标识、传递与解析难的问题。
指标指数分类与测算标准:提升数据应用价值
长期以来,各地建设工程造价管理机构发布了大量建设工程的造价指标,这些造价指标多以“典型工程”形式出现,在实际应用中的作用并不大,应用效能有限。核心问题有三点:其一,现实中工程项目的种类、形式是多样的,少量工程项目的造价指标,在现实工作中能够起到的作用不大。其二,由于工程项目的构成较为复杂,单项工程指标所包含的单位工程、分部分项内容如果不明确,造价指标没有可对比性。其三,指标的计算方式也很重要,是按照算术平均计算还是加权平均计算,没有统一标准,结果差异较大,会影响造价指标的使用。
针对上述问题,住房城乡建设部标准定额司组织修订《建设工程指标指数分类与测算标准》,推动各建设工程项目的指标指数更加具有可比性,加快释放造价数据的同类参考价值。
建设工程造价信息化标准体系的构建,为建设工程造价数字化提供了有力支撑,国家建设工程造价监测平台正是依托这些标准得以建成,目前已经累计收集到68万建设工程项目的造价成果文件。这些标准的建立与数据资源的积累,共同为后期利用AI技术在造价领域的深度应用扫清障碍、铺平道路。
利用AI技术加工造价指标 支撑造价成果文件编制——AI技术助力新清单计价标准落地实施(三)
工程造价改革需要以数据的积累与应用作为支撑,数据标准保障了数据的积累与应用,而数据加工整理的技术实现路径,成为当前亟待破解的关键课题。
事实上,很多地区依托地方数据标准,已经积累了一定的数据资源,但是对于数据的加工整理缺乏有效方法与路径,导致大量积累的数据资源处于“半闲置”状态。建设工程造价数据,结构化程度高、逻辑严谨。数据描述存在多样性,传统的信息化技术手段很难将多样的数据描述进行归类整理,也很难发现异常数据。
当前基于AI大模型技术,经过大量的造价专业数据训练后,算法能够从多元数据描述中,精准抽取出数据的特征项与特征值,使得数据的同类归集与整理加工成为可能。
数据处理加工需要解决的问题
只有同类型工程项目的造价数据才有可对比性,需要为造价数据赋予工程项目的特征值。行业已编制了相应的工程特征与分类描述标准。这些特征值如何赋予,是需要解决的问题。通过AI算法自动解读造价数据成果文件,提取工程项目的特征信息,成为有效的技术路径。
工程量清单的编码与项目名称已经实现统一。清单项目的特征描述,需要造价人员依据清单计价标准给定的特征项,结合工程的实际情况自行描述。从目前收集到的工程造价数据来看,特征描述是多种多样的。如何通过AI算法,从多样的特征描述中提取到相应的特征项与特征值,是数据处理的核心环节。
AI技术的特点及技术边界
计算机底层的算法依然是二进制的逻辑推理,针对AI技术,需建立清晰的认知——它有明确的实现逻辑与技术边界,并非“万能工具”。
在造价数据的整理分析领域,“拿来主义”显然是行不通的,需要根据使用场景,利用整理后的造价数据文件作为“训练”素材,分别打造工程造价领域专属“大模型”,再依托“造价专用大模型”开展对造价数据文件的分析处理及造价指标指数的加工工作。
造价数据整理分析的工作基础
国家建设工程造价数据监测平台自2017年正式上线以来,经过多年的使用及持续升级与优化,已取得了较显著的阶段性成果。
截至目前,平台已累计收集68万余份造价成果文件数据。这些成果文件数据来源丰富,地域上覆盖了全国绝大多数省市地区,专业领域涉及建筑工程、市政工程、城市轨道交通工程等多个专业方向,工程类型涵盖居住建筑、商业建筑、办公建筑等多种建筑类型,数据类型则包括投资估算、设计概算、最高投标限价、合同价及竣工结算价,覆盖了工程的全过程,形成了庞大且丰富的造价数据资源,为后续建立国家建设工程造价数据库及数据分析和应用奠定了坚实的数据基础。
AI技术驱动的造价数据解决方案
培育工程造价行业的“专属大模型”。北京建科研软件技术有限公司作为国家建设工程造价数据监测平台的研发、运维单位,充分利用积累的数据资源,研究并训练出适合建设工程造价行业的“造价专用大模型”。
整理大量的历史造价数据并在数据之间进行关联。通过建立造价数据关联模型,挖掘不同来源、不同类型、不同层级数据之间的潜在关联并纳入系统整合,构建覆盖全面、系统科学的训练数据集,进而训练出工程造价垂域能力的大模型。应用上述专属LLM(大语言模型)处理海量原始数据,形成工程特征自动解析及清单级指标加工工具,此类工具具备高度的适配性和可操作性,考虑到不同建设地域在经济发展水平、工程建设特点、地域差异等方面存在多样性,这些算法工具可以提供给各省建设工程造价管理机构,各地区可以根据自身实际情况对收集的造价数据进行指标加工与发布。
清单级造价指标支撑下的造价成果文件编制。造价指标来自市场实际数据,具备可追溯性,能够充分反映市场的真实情况,尤其是清单级造价指标,可以实现各种清单特征组合的全面覆盖,具体到每种特征的工程量清单项目。各级造价管理机构通过收集到的造价数据成果文件可以加工出本地区的清单造价指标,针对每一个清单指标的数值范围,可以制定相应的规则,例如,合格工程的最高投标限价取60分位值,省优工程的最高投标限价取75分位值,国优工程的最高投标限价取85分位值,这样就可以有效解决建设工程项目的最高投标限价编制问题。对于施工企业的投标报价,可以通过积累本企业的历史数据,采用类似方法,加工成企业自身的造价指标,在实际工程中不断验证、修正自己的企业造价指标,进而支撑造价文件的编制任务。


