| 位置: 主页 > 杏耀动态 >

浅谈数据挖掘在化学研究与生产中的应用

时间:2019-01-27 15:05  点击:  作者:飞天小白龙  来源:杏耀平台原创

杏耀娱乐资讯:

化学是研究化合物、的组成及其变化的学科。在长期化学的、化学实验中,产生了大量的数据,但数据的大量增加造成了信息过多等信息、信息安全风险、信息难以区分。与此同时,这些海量数据中有许多有价值的信息和法律。如何从这些数据中找到更有价值的信息和法律已成为化学专家、的重点。它需要成为发明之母。这一要求,数据挖掘技术在化工、化学工业中的应用应运而生,并显示出强大的生命力。在化学领域,数据挖掘理论和算法的发展极大地促进了计算机化学、化学计量学和化学信息学等新学科的发展。本文简要介绍了数据挖掘方法在化学、化学工业各个方面的应用。

2数据挖掘概述

数据挖掘(Datamining)是数据库知识发现(KDD,Knowledge-DiscoveryinDatabases)中的一个步骤。数据挖掘通常是指通过算法搜索从大量数据中发现隐藏在其中的规则和信息的过程。在过去的十年中,数据挖掘技术在理论和实际应用中都取得了很大的进步[1],并且出现了各种特殊或商业数据挖掘软件。

数据挖掘领域使用的主要思想是:统计抽样、估计和假设检验;人工智能、模式识别和机器学习搜索算法、建模技术和学习理论。数据挖掘还迅速接受了优化、进化计算、信息理论、信号处理、在可视化和信息检索领域的思路。目前,常用的数据挖掘方法主要有以下几种:数学统计方法、决策树、模式识别方法、人工神经网络方法、遗传算法、粗糙集方法、支持向量机方法。

数据挖掘利用多学科领域的知识,从新的角度和更深层次探索大量信息中存在的新颖的、模型。在化学和化学生产中使用这种数据挖掘技术可以从化学和化学生产数据中找到潜在的法律,并使用这些规则来指导企业的生产过程,并最终优化生产过程并最大化企业的利益。方兆华等分析了中草药在化妆品专利中使用的关联规律,发现当归中含有当归、白芍和芦荟等高频单味药,当归,川芎等高频药,和高频如芦荟 - 芝麻 - 向日葵。在对信心和支持的分析的基础上,获得了中草药在化妆品中应用的13个强关联规则,如葵花籽和芝麻籽。陆爱军等。用关联规则研究了有效成分、中草药提取物、植物化学物质、与现代药理学的关系。在分析之前对数据进行预处理,然后处理处理后的数据。挖掘,从而获得一些有趣的关联规则,例如中药效力与植物分类之间的关联,是因为该家族下的许多植物具有相应的中药效应。

浅谈数据挖掘在化学研究与生产中的应用

3.2化学研究中的数据挖掘

朱建国分析了数据的具体特征,并利用ID3的决策树算法对数据离散化和属性选择进行了预处理,使树结构的分类器能够更有效地对数据进行分类。通过对二苯乙烯系列化合物实验数据的建立过程及所得规则的分析,将决策树有效地应用于二苯乙烯系列化合物的研究过程,并开发了开发系统,使研究人员能够清晰地表达分类。这些规则为研究人员带来了极大的便利。

李峰等应用数据挖掘在稀土掺杂纳米TiO2结构与光催化活性的关系,并采用多元逐步回归分析探讨数据样本之间的关系,并发现结构参数与光催化剂的表观速率常数之间的关系。相关性良好,相关系数大于0.99,表明该模型具有良好的稳定性和预测能力。溶胶 - 凝胶法制备的不同稀土掺杂纳米TiO2表明,纳米结构相似,光催化活性相似。光催化剂的制备及其动力学性质更好。建立了定量构效关系,并对XRD参数进行了测试,找到了具有相似活性的催化剂,为选择高效光催化剂节约了资源。

浅谈数据挖掘在化学研究与生产中的应用

Ru等人。提出了一种名为BSVR(Boosting支持向量回归)的方法,它支持向量回归,使用Boosting结合支持向量回归(SVR)作为分类器,然后用它来处理硝基苯并将其用作5-苯基的QSAR数据[2H] - 四氢 - 三嗪-3-酮5-脂氧合酶抑制剂的化合物可预测其毒性。实验结果表明,该方法对病毒预测的准确性有显着提高。蔡和冯等人。提出了一种名为LogistBoost的算法,该算法基于对数回归策略,可以预测蛋白质结构数据的2x1776类多类分类问题(基于氨基酸序列)。实验结果表明,该算法表明该算法具有良好的预测效果。 Boosting算法在蛋白质结构分类中的预测应用是以蛋白质的氨基酸类型、为主要属性来判断蛋白质的二级结构。随着数据挖掘在化学中的应用,Boosting算法有望预测蛋白质的三维结构。弗里德曼等人。提出了一种梯度Boosting算法,该算法直接将Boosting算法应用于回归问题,有效地解决了数据挖掘中化学应用回归中的常见问题,以及Tao等人提出的新Boosting算法。解决了化学应用中数据挖掘中检测异常值的问题。

3.3化学生产中的数据挖掘

张全玲等。利用多支持关联规则挖掘算法开发化工生产过程数据挖掘软件,通过数据挖掘软件优化操作参数和配方,提高产品的产量和有效成分,并应用于系统。在三唑磷的合成过程中,三唑磷的产率提高了1.5%,三唑磷的含量也提高了3个百分点,从80%提高到83%,为企业带来了更好的效果。经济效益和社会效益。

陆志荣等人利用数据挖掘方法开发了一系列适用于生产过程优化的DMOS软件、故障诊断、优化新产品开发和配方设计,为化工行业生产过程的工程运行优化创造了条件、精炼该系统应用于石油化工厂,主要解决丙烯产率不能满足下游生产的问题。更重要的是,回收的丙烯产率的增加可以提高经济效益。结果表明,DMOS数据挖掘后提出了新的生产参数。在优化原始正常生产状态后,丙烯的产率增加,并且优化的丙烯产率从14.7%增加至19.11%。数据挖掘基于合成氨的生产效率,用于解决氨合成氨合成设备的DMOS合成氨优化系统,用于解决工业氨生产参数的优化,氨合成设备实时状态诊断生产、实时趋势浏览、优化操作指南、报告生成等功能。通过对云威集团有限公司氨合成装置合成塔产生的数据进行数据挖掘,找出影响装置目标变量的主要工艺参数,以及目标变量与目标变量之间的数学模型。建立相关的工艺参数。实验表明该模型是可靠的。强大的性质,可以优化工厂的工艺运作,增加合成氨的产量,全面提高企业的经济效益。3.4化学分类中的数据挖掘

Li Lin等[15]使用决策树对玻璃和葡萄酒进行分类。玻璃有九个属性作为衡量标准。这款酒是意大利的三种葡萄酒。、包含13个属性作为分类指标。他们首先使用MDLP(最小长度描述方法)进行离散化,然后使用LVF(LasVegasFilter)方法选择属性,消除冗余数据,然后通过C4.5方法构造决策树。实验表明,决策树构建的分类模型具有良好的预测性能,适用于化学分类知识模型的挖掘。基于预处理的决策树克服了一般决策树方法的缺点,即难以处理连续数据集,并且具有其他方法不具备的优点。它可以从大量数据中挖掘潜在的分类知识,并具有简单直观的表达方式。表格,便于专业人士理解和分析。

4。结论

本文发现并挖掘了有关数据挖掘方法如何在化学和化学生产过程中使用海量数据、的新法律和信息,为化学研究和化学生产提供了有效和准确的基础。虽然数据挖掘技术在化学和化学生产过程中已经获得了很多应用,但目前的应用范围并不是很广。化学和化学生产过程中的应用目前是数据挖掘的研究热点,越来越受到研究者的青睐。数据挖掘技术可以基于来自各种化学和化学生产领域的数据挖掘有价值的和隐藏的知识。因此,在化学研究过程中、化学生产过程建模、控制、优化、故障诊断等方面具有非常重要的研究价值,并且越来越显示其重要作用。


如果喜欢此文章,转载请注明本文地址:http://www.hb2520.com/afd/xingyedongtai/20190127/737.html

杏耀娱乐平台股份有限公司成立于2012年4月,是首家从事杏耀平台注册,杏耀手机游戏注册研究的高科技企业

Copyright © 2012-2019 版权所有:杏耀娱乐官方网站 本站技术支持:www.hb2520.com 备案号:浙ICB备-551264214-B43