蜕变后的CPA软件已经可以初步完成一些简单的模型代码。
目前支持的有深度神经网络、梯度提升树、线性回归、朴素贝叶斯、随机森林、组合模型等等监督模型。
同时也引入了tensorlow等组件以支持直接在该软件上使用深度学习算法。
苏航真的想搞一个语音识别装上去。
到时候一开机,说一句,小C,建模,然后哗哗哗地模型就搞好了,多爽。
但是这个要点时间,还得花精力去小C里面找接入口,话说苏航还没有查过小C的核心代码,还不确定能不能看懂。
虽然目前它也可以完成一些简单的自动建模,这里的自动只是相对而言,严格地讲,还是半自动的。
因为有很多参数要手动设计,比如模型的个数和最长训练时间。
这个自然是越长越好,不过硬件跟不上软件。
就像某位前辈发现人类的身躯限制了自己实力的增长,果断选择不当人。
苏航感觉自己这台移动工作站就限制了小C的成长。
要是放到太湖之光上,岂不是……
咳咳,这个想想就好。
要是不限制最长时间和测试模型个数上限,小C就会跑程序跑个没玩,当一些参数不满足要求的时候,然后就一个个模型去试啊,最后发现过拟合了,又去拉更多的数据,又去换模型,或者自动对数据去清洗或者增加噪声。
然后就跑个没完没了,跑一晚上都是可能的。
有个现代的伟人,忘了啥名字,就讲过他上大学的那个时候的电脑不会识别死循环,然后他码了个程序放那运行并设置自动打印结果,然后就走了,因为结束了会自动停止嘛,就没管了。
结果周一回来,被告知要缴纳罚款,原因是微机房打印机的纸全打印完了,还好机子没坏。
现在计算机虽然会识别死循环,但是面对长时间的模型拟合还是会出现类似的情况。
苏航的小C就是如此。
更进一步的,小C还可以自动进行模型组合,可以将所有训练好的模型作为base model进行融合,也可以通过各个模型amily中最好的那个模型作为base model进行融合,融合的方式默认为GLM线性回归。
此外,小C还有一个类似于Simulink一样的建模板块。
可以更加简单地建立模型,而不需要对R语言和Python了解太多。
就是“托拉拽式建模”。
像什么读取数据集、读取SQL表、将数据集划分为训练集和测试集等等,这个虽然简单,但是命令语句不多。
要进行大型、复杂的模型,这个还不够。
当然,对于建立CNN和RNN,小C还是不太好用,自动生成的代码还需要一些微调。
对苏航而言,能够替代一部分的劳动就足够了。
这一次,苏航决定利用人工智能神经网络和模糊逻辑等方式来对一些大型地下工程的土体变形进行预测,进一步实现通过对施工的技术参数调整,达到变形控制的目的。
不要看现在科技多么发达,技术多么先进,高楼大厦那么高,地下工程那么多,其实人类对大地的了解还远远谈不上深刻。
一条几公里的地铁线路,在开挖前,地下是什么情况,谁也不知道。
水、孤石等都是地下工程的大敌。
就算是每隔50米进行一次钻孔勘察,那一公里也就200来个点,要去预测000米的路线上的地质情况。
很难。
死的人,很多。
相关的研究也一直在做,但是一直都很难。
常言道,三里不同风,十里不同俗。
土壤也是这样。
你可以把地质归类,但是不能说一类地质就是怎么样的。