根据不同中药材在近红外、中红外光谱的照射下表现的光谱特征具有较大差异,本文主要根据光谱特征进行鉴别中药材的种类及其产地。建立了数据可视化分布模型,利用了改进的K-means聚类模型、相关系数、距离判别法、平均相关系数和BP神经网络等模型。
对于问题一:首先,将附件 1 的光谱数据可视化,直观的分析了不同药材的分布特征和差异;其次,利用Python的Matplotlib库将附件1的数据绘制成直方图(见附录1),确定了大致可分为3类;最后,建立了K-means聚类模型,第三类数据直观上差异较大,故又建立了改进的K-means聚类模型,不先指定类数,再次验证了分为3类是合理的。
对于问题二:首先,利用Matplotlib库将同一产地不同波数下的数据求均值,并可视化,分析了不同产地的特征及差异;其次,利用Python数据分析未知产地数据,与已知产地的数据进行计算相关性系数,产地的相关系数求平均,即。最大,说明属于产地;最后,建立了反向传播神经网络模型进行了第二次分产地演算,得到了产地的归属。
对于问题三:首先,利用Python的corr函数求得了未知产地和已知产地的相关系数,将同一产地的相关系
1