基于SPSS因子分析和判别分析的祖母绿产地溯源方法

allin2023-04-02  66


基于spss因子分析和判别分析的祖母绿产地溯源方法
技术领域
1.本发明属于祖母绿产地溯源技术领域,尤其涉及一种基于spss因子分析和判别分析的祖母绿产地溯源方法。


背景技术:

2.目前,宝石的产地溯源一直是珠宝行业关注的重要课题,产地效应对宝石价格和市场需求的影响越来越强,而计算机和人工智能的发展使数学模型应用于各个领域成为了可能。
3.近年来宝石产地溯源的研究越来越火热,由于价格和市场需求的影响,越来越多的方法被运用在宝石的产地溯源上。
4.祖母绿是绿柱石矿物中最为名贵的宝石品种,享有“绿色宝石之王”的美称,它与钻石、红蓝宝石、金绿宝石并称为“五大宝石”。世界上的祖母绿产地众多,在五大洲均有发现,其中最主要的大区是南美洲和非洲。市场上销售的祖母绿大多来自以下几个产地:南美洲的哥伦比亚和巴西,非洲的津巴布韦、赞比亚、坦桑尼亚和尼日利亚,亚洲的印度、俄罗斯,以及我国的云南和新疆。其中哥伦比亚的木佐矿是最著名的祖母绿矿区,一颗祖母绿若被定为哥伦比亚产区,价格会高出其他产地祖母绿的30%~40%。不同产地的祖母绿矿床类型不同,所以含有的元素种类和含量也不尽相同。
5.目前宝石的产地溯源所使用的方法大致可分为以下几种:(1)从内外部特征上区分。例如缅甸红宝石的“鸽血红”、“糖浆状”颜色特点,克什米尔蓝宝石的“矢车菊”浓重蓝色、哥伦比亚祖母绿的三相包体等;(2)从特殊光学效应上区分,这个适用于那些具有特殊光学效应的宝石,比如变石。不同产地变石的变色效应有差别,比如斯里兰卡变石在日光下偏黄绿色,在烛光下显棕或橙色调,而巴西变石在日光下偏蓝绿色,在烛光下为偏紫的红色;(3)从化学元素上区分。不同产地的宝石因其围岩和形成原因的不同,含有的化学元素的种类和含量也有差别。一般来说,因为是同种宝石,所以主要化学元素上差别不大,若要进行产地区分,可考虑从微量元素和同位素上进行分析。
6.由于产地效应的影响,哥伦比亚祖母绿总是质优和价高的象征,人们希望找到一种既快速便捷又准确无损的方法对祖母绿的产地进行鉴别。随着计算机和多元统计方法的发展,数理模型越来越多地被应用在更广泛的学科上。为了找寻区分祖母绿产地的方法,选取了前人文献中的九个产地祖母绿的元素数据,利用spss对这些数据进行分析和建模。使用相关分析做多重共线性诊断,因子分析做相关性辅助,判别分析做产地归类,对来自中国云南麻栗坡、巴基斯坦斯瓦特山谷、马达加斯加马南扎里、阿富汗潘杰希尔山谷、巴西伊塔比拉、埃塞俄比亚、赞比亚卡夫布、津巴布韦桑德瓦纳和俄罗斯乌拉尔的九个产地的祖母绿进行产地溯源。
7.通过上述分析,现有技术存在的问题及缺陷为:现有技术尚没有智能化进行祖母绿产地溯源的方法或系统,而现有的溯源方法繁琐且准确性不高。
8.解决以上问题及缺陷的难度为:需要大量已知产地的祖母绿的化学成分数据扩充
数据库,增强结果的可信度;建立能够快速且准确判别祖母绿产地的数学模型。
9.解决以上问题及缺陷的意义为:能够快速且准确的判断祖母绿的产地,满足了市场及消费者的需求,对规范不同产地祖母绿的市场价格有着重要的作用。


技术实现要素:

10.针对现有技术存在的问题,本发明提供了一种基于spss因子分析和判别分析的祖母绿产地溯源方法。
11.本发明是这样实现的,一种基于spss因子分析和判别分析的祖母绿产地溯源方法,所述基于spss因子分析和判别分析的祖母绿产地溯源方法包括:
12.利用不同产地祖母绿的化学成分数据,结合spss的因子分析和判别分析对祖母绿样品进行产地判别。
13.进一步,所述基于spss因子分析和判别分析的祖母绿产地溯源方法包括以下步骤:
14.步骤一,利用la-icp-ms获取不同产地祖母绿的化学成分数据,由于相同宝石在主量元素上的差别甚微,选择微量元素作为模型的变量。祖母绿结构通道中存在的碱金属离子对祖母绿的地理成因具有极强的敏感性,利用li、na、k、rb、cs及sc和ga做二元散点图,能够区分已有数据的祖母绿产地。因此,从获取的不同产地祖母绿的化学成分数据中提取不同产地的祖母绿中以上的微量元素及微量元素的含量;
15.步骤二,利用spss软件对得到的li、na、k、rb、cs及sc和ga这7组微量元素离子数据进行因子分析,利用线性回归分析对数据多重共线性进行预估;基于因子分析结果以及预估结果确定溯源变量;
16.步骤三,基于确定的溯源变量构建产地判别模型,使用费舍尔判别函数,把数据中缺失值替代为平均值,使用的协方差矩阵为组内,先验概率设定为所有组相等且留一部分数据作为验证集构建判别模型,利用构建的产地判别模型进行祖母绿产地溯源。
17.进一步,所述产地包括:中国云南麻栗坡、巴基斯坦斯瓦特山谷、马达加斯加马南扎里、阿富汗潘杰希尔山谷、巴西伊塔比拉、埃塞俄比亚、赞比亚卡夫布、津巴布韦桑德瓦纳和俄罗斯乌拉尔。
18.进一步,所述微量元素包括:li、na、k、rb、cs、sc和ga。
19.进一步,所述溯源变量为不同产地祖母绿中的碱金属化学元素含量以及元素sc和ga的含量。
20.进一步,所述利用构建的产地判别模型进行祖母绿产地溯源之前还需进行:获取待溯源的祖母绿数据。
21.进一步,所述利用构建的产地判别模型进行祖母绿产地溯源包括:利用构建的产地判别模型基于待溯源的祖母绿数据进行祖母绿产地溯源。
22.本发明的另一目的在于提供一种基于spss因子分析和判别分析的祖母绿产地溯源方法的基于spss因子分析和判别分析的祖母绿产地溯源系统,所述基于spss因子分析和判别分析的祖母绿产地溯源系统包括:
23.数据集构建模块,用于获取不同产地祖母绿的化学成分数据,从获取的不同产地祖母绿的化学成分数据中提取不同产地的祖母绿中的微量元素及微量元素的含量,构建数
据集;
24.数据分析模块,用于对得到的7组微量元素离子数据进行因子分析,利用线性回归分析对数据多重共线性进行预估;基于因子分析结果以及预估结果确定溯源变量;
25.判别模型构建模块,用于基于确定的溯源变量构建产地判别模型;
26.溯源模块,用于利用构建的产地判别模型对待溯源的祖母绿数据进行祖母绿产地溯源。
27.本发明的另一目的在于提供一种接收用户输入程序存储介质,所存储的计算机程序使电子设备执行基于spss因子分析和判别分析的祖母绿产地溯源方法,包括下列步骤:
28.步骤一,获取不同产地祖母绿的化学成分数据,从获取的不同产地祖母绿的化学成分数据中提取不同产地的祖母绿中的微量元素及微量元素的含量;
29.步骤二,对得到的7组微量元素离子数据进行因子分析,利用线性回归分析对数据多重共线性进行预估;基于因子分析结果以及预估结果确定溯源变量;
30.步骤三,基于确定的溯源变量构建产地判别模型,利用构建的产地判别模型进行祖母绿产地溯源。
31.本发明的另一目的在于提供一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以实施基于spss因子分析和判别分析的祖母绿产地溯源方法。
32.结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明克服了原溯源方法的经验性、不确定性和繁琐性,在庞大数据库的基础上建立的此模型,可利用少量数据判别祖母绿的产地,且快速高效准确。本发明能够对不同产地祖母绿进行产地溯源,且溯源准确率高。
附图说明
33.图1是本发明实施例提供的基于spss因子分析和判别分析的祖母绿产地溯源方法流程图。
34.图2是本发明实施例提供的基于spss因子分析和判别分析的祖母绿产地溯源系统结构示意图;
35.图中:1、数据集构建模块;2、数据分析模块;3、判别模型构建模块;4、溯源模块。
36.图3是本发明实施例提供的典型判别函数图。
具体实施方式
37.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
38.针对现有技术存在的问题,本发明提供了一种基于spss因子分析和判别分析的祖母绿产地溯源方法,下面结合附图对本发明作详细的描述。
39.本发明实施例提供的基于spss因子分析和判别分析的祖母绿产地溯源方法包括:
40.利用不同产地祖母绿的化学成分数据,结合spss的因子分析和判别分析对祖母绿样品进行产地判别。
41.如图1所示,本发明实施例提供的基于spss因子分析和判别分析的祖母绿产地溯源方法包括以下步骤:
42.s101,获取不同产地祖母绿的化学成分数据,从获取的不同产地祖母绿的化学成分数据中提取不同产地的祖母绿中的微量元素及微量元素的含量;
43.s102,对得到的7组微量元素离子数据进行因子分析,利用线性回归分析对数据多重共线性进行预估;基于因子分析结果以及预估结果确定溯源变量;
44.s103,基于确定的溯源变量构建产地判别模型,利用构建的产地判别模型进行祖母绿产地溯源。
45.本发明实施例提供的产地包括:中国云南麻栗坡、巴基斯坦斯瓦特山谷、马达加斯加马南扎里、阿富汗潘杰希尔山谷、巴西伊塔比拉、埃塞俄比亚、赞比亚卡夫布、津巴布韦桑德瓦纳和俄罗斯乌拉尔。
46.本发明实施例提供的微量元素包括:li、na、k、rb、cs、sc和ga。
47.本发明实施例提供的溯源变量为不同产地祖母绿中的碱金属化学元素含量及元素sc和ga含量。
48.本发明实施例提供的利用构建的产地判别模型进行祖母绿产地溯源之前还需进行:获取待溯源的祖母绿数据。
49.本发明实施例提供的利用构建的产地判别模型进行祖母绿产地溯源包括:利用构建的产地判别模型基于待溯源的祖母绿数据进行祖母绿产地溯源。
50.如图2所示,本发明实施例提供的基于spss因子分析和判别分析的祖母绿产地溯源系统包括:
51.数据集构建模块1,用于获取不同产地祖母绿的化学成分数据,从获取的不同产地祖母绿的化学成分数据中提取不同产地的祖母绿中的微量元素及微量元素的含量,构建数据集;
52.数据分析模块2,用于对得到的7组微量元素离子数据进行因子分析,利用线性回归分析对数据多重共线性进行预估;基于因子分析结果以及预估结果确定溯源变量;
53.判别模型构建模块3,用于基于确定的溯源变量构建产地判别模型;
54.溯源模块4,用于利用构建的产地判别模型对待溯源的祖母绿数据进行祖母绿产地溯源。
55.下面结合具体实施例对本发明的技术方案做进一步说明。
56.实施例1:
57.1数据来源
58.本次分析所使用的数据一部分来自本人用la-icp-ms测试的巴基斯坦斯瓦特山谷的祖母绿数据,另一部分来自前人的文献所测的其他产地祖母绿数据。一共选择中国云南麻栗坡、巴基斯坦斯瓦特山谷、马达加斯加马南扎里、阿富汗潘杰希尔山谷、巴西伊塔比拉、埃塞俄比亚、赞比亚卡夫布津巴布韦桑德瓦纳和俄罗斯乌拉尔九个产地的祖母绿数据进行分析。
59.由于样品都属于化学式为be3al2(sio3)6的矿物,在结构和主要化学成分的种类和含量上差异不大,但来自不同产地的样品具有不同成矿环境和成矿流体,所以类质同象替代程度不同,导致祖母绿中所含的元素种类和含量也不相同,可以用其中的微量元素含量
进行产地分类模型的建立。
60.由于祖母绿结构通道中具有大半径低电价的碱金属离子且与成矿流体及类质同象替代有关,则可以作为产地区分所使用的的元素种类。同时经二元投点图可得,sc和ga可以把巴基斯坦祖母绿从其他产地从区分出来。
61.所有数据如表1所示。
62.表1不同产地祖母绿中碱金属含量数据表
63.64.65.66.67.[0068][0069]
2相关性和共线性检验
[0070]
为了达到降维的目的,减少因变量太多造成的信息重复性和模型复杂性,对所获得的7组元素离子数据进行因子分析,观察能否通过因子分析在数据信息丢失最少的情况下减少变量的个数,消除变量的相关性以便后续更好的开展判别和聚类分析。
[0071]
把九个产地的数据输入spss软件,选择因子分析并运用因子旋转的方法得出如下数据表和图。
[0072]
表2.kmo和巴特利特检验
[0073][0074]
从kmo和巴特利特检验表中可以看出,kmo值为0.393,小于0.6,表明变量间相关性低。从碎石图上可以看出,对于所有数据所蕴含的信息来说,每个公共因子所提取的信息是差不多的,表明每组数据所含的信息相关性很低。
[0075]
用线性回归分析对数据多重共线性做一个初步的预估,与因子分析的相关性相互应征。
[0076]
表3系数a[0077][0078]
从表3中可以看到,每个变量的vif值都小于5,这表明这些变量之间不存在严格的多重共线性,可以用来做判别分析。
[0079]
3判别分析
[0080]
选择七组数据进行贝叶斯判别分析,得到如下结果,如表4所示。
[0081]
表4分析个案处理摘要
[0082][0083]
表4是缺失值报告表,从表中结果来看,有12个缺失值,缺失值使用平均值代替。没有留出待判的样本,对模型的检测主要看交叉检验。
[0084]
表5平均值的同等检验
[0085][0086]
表5显示,所有变量都通过了显著性水平为0.05的检验,表明所有变量对建立判别函数的贡献都显著,所以这些变量对模型解释的显著性是较高的。
[0087]
表6特征值
[0088][0089]
表7威尔克lambda
[0090][0091]
通过表6和表7分析可知,第一判别函数的累计方差贡献率达到41.8%,相对于其他函数来说比较高,而且从威尔克lambda表上可以得到,函数1到7都通过了显著性水平α为0.05的显著性检验,因此这四个典型判别函数对于探寻自变量元素与因变量产地之间关系的作用都很显著。
[0092]
表8典则判别函数系数
[0093][0094][0095]
表8显示的是自变量碱金属离子含量与因变量产地之间的关系函数,通过表6和表7可知,前两个判别函数的相关性相对较高,因此判别产地时使用前两个判别函数进行预
判。把自变量的数据带入函数1和2,选择距离较近的因变量作为判别的结果。
[0096]
表9组质心处的函数
[0097][0098]
表9是根据给出的数据利用判别函数1和2计算出的每个产地组质心的函数值,图2为可视化函数图。由上图可看出,横坐标为典型判别函数1,纵坐标为典型判别函数2,利用此两种典型判别函数算出各个样品值的坐标。图中九个方框表示每个产地样品的组质心,得出坐标之后根据坐标离中心的远近判断待判样品属于哪个产地。不同颜色的圆圈代表不同产地,相同颜色的圆圈有一定的聚类效果,但有些点位重叠,从总体上看,此图对产地有很好的区分度。
[0099]
[0100][0101]
表10列出了案例回代判别正确错误情况和交互验证的判别正确错误情况,在一般回代中对于产地1判断正确24个,错误0个,正确率为100%;产地2判断正确48个,错误1个,正确率为98%;产地3判断正确23个,错误3个,正确率88.5%;产地4判断正确21个,错误5个,正确率80.8%;产地5判断正确53个,错误0个,正确率为100%,产地6判断正确18个,错误0个,正确率为100%,产地7判断正确17个,错误1个,正确率为94.4%,产地8判断正确13个,错误0个,正确率为100%,产地9判断正确15个,错误0个,正确率为100%,总正确率为95.9%。而在交叉回代判别中,总正确率比前者低为91.7%,其中马达加斯加和阿富汗潘杰希尔山谷的祖母绿判别正确率稍低。总的来说,判别模型的判别正确率高,模型有很好的区分度。
[0102]
从判别分析的结果来看,利用数理模型中的判别分析方法对不同产地祖母绿进行产地溯源的正确率可达90%,因此利用此方法对不同产地宝石进行产地溯源是具有可行性的。
[0103]
祖母绿作为绿色宝石之王在五大洲均有发现,目前市场上占据主流的产地有哥伦比亚、巴西、赞比亚、俄罗斯、津巴布韦、马达加斯加和巴基斯坦等地。其中排名前几的为哥伦比亚、巴西和赞比亚。gaston giuliani和lee a.groat经过研究按照地质环境分成两种类型,第一类为构造-岩浆有关,第二类与构造-变质作用有关,由于地质作用的不同,祖母绿中所含的元素种类和含量也不同,可以利用此进行产地判别分析。
[0104]
利用spss对来自九个产地的242组祖母绿样品数据进行产地判别,从因子分析看出,kmo值小于0.6,表明作为变量的七组元素含量之间没有相关性,同时利用线性回归的多重共线性诊断发现变量无明显的多重共线性。
[0105]
判别分析可达到91.7%的较高正确率,证明利用数理模型中的判别模型,以不同产地宝石中的元素作为变量进行产地溯源是具有很大潜力的。
[0106]
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、cd或dvd-rom的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
[0107]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

技术特征:
1.一种基于spss因子分析和判别分析的祖母绿产地溯源方法,其特征在于,所述基于spss因子分析和判别分析的祖母绿产地溯源方法包括:利用不同产地祖母绿的化学成分数据,结合spss的因子分析和判别分析对祖母绿样品进行产地判别。2.如权利要求1所述基于spss因子分析和判别分析的祖母绿产地溯源方法,其特征在于,所述基于spss因子分析和判别分析的祖母绿产地溯源方法包括以下步骤:步骤一,获取不同产地祖母绿的化学成分数据,从获取的不同产地祖母绿的化学成分数据中提取不同产地的祖母绿中的微量元素及微量元素的含量;步骤二,对得到的7组微量元素离子数据进行因子分析,利用线性回归分析对数据多重共线性进行预估;基于因子分析结果以及预估结果确定溯源变量;步骤三,基于确定的溯源变量构建产地判别模型,利用构建的产地判别模型进行祖母绿产地溯源。3.如权利要求2所述基于spss因子分析和判别分析的祖母绿产地溯源方法,其特征在于,所述产地包括:中国云南麻栗坡、巴基斯坦斯瓦特山谷、马达加斯加马南扎里、阿富汗潘杰希尔山谷、巴西伊塔比拉、埃塞俄比亚、赞比亚卡夫布、津巴布韦桑德瓦纳和俄罗斯乌拉尔。4.如权利要求2所述基于spss因子分析和判别分析的祖母绿产地溯源方法,其特征在于,所述微量元素包括:li、na、k、rb、cs、sc和ga。5.如权利要求2所述基于spss因子分析和判别分析的祖母绿产地溯源方法,其特征在于,所述溯源变量为不同产地祖母绿中的碱金属化学元素含量及元素sc和ga含量。6.如权利要求2所述基于spss因子分析和判别分析的祖母绿产地溯源方法,其特征在于,所述利用构建的产地判别模型进行祖母绿产地溯源之前还需进行:获取待溯源的祖母绿数据。7.如权利要求2所述基于spss因子分析和判别分析的祖母绿产地溯源方法,其特征在于,所述利用构建的产地判别模型进行祖母绿产地溯源包括:利用构建的产地判别模型基于待溯源的祖母绿数据进行祖母绿产地溯源。8.一种实施如权利要求1-7任意一项基于spss因子分析和判别分析的祖母绿产地溯源方法的基于spss因子分析和判别分析的祖母绿产地溯源系统,其特征在于,所述基于spss因子分析和判别分析的祖母绿产地溯源系统包括:数据集构建模块,用于获取不同产地祖母绿的化学成分数据,从获取的不同产地祖母绿的化学成分数据中提取不同产地的祖母绿中的微量元素及微量元素的含量,构建数据集;数据分析模块,用于对得到的7组微量元素离子数据进行因子分析,利用线性回归分析对数据多重共线性进行预估;基于因子分析结果以及预估结果确定溯源变量;判别模型构建模块,用于基于确定的溯源变量构建产地判别模型;溯源模块,用于利用构建的产地判别模型对待溯源的祖母绿数据进行祖母绿产地溯源。9.一种接收用户输入程序存储介质,所存储的计算机程序使电子设备执行如权利要求1-7任意一项基于spss因子分析和判别分析的祖母绿产地溯源方法,包括下列步骤:
步骤一,获取不同产地祖母绿的化学成分数据,从获取的不同产地祖母绿的化学成分数据中提取不同产地的祖母绿中的微量元素及微量元素的含量;步骤二,对得到的7组微量元素离子数据进行因子分析,利用线性回归分析对数据多重共线性进行预估;基于因子分析结果以及预估结果确定溯源变量;步骤三,基于确定的溯源变量构建产地判别模型,利用构建的产地判别模型进行祖母绿产地溯源。10.一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以实施如权利要求1-7任意一项基于spss因子分析和判别分析的祖母绿产地溯源方法。

技术总结
本发明属于祖母绿产地溯源技术领域,公开了一种基于SPSS因子分析和判别分析的祖母绿产地溯源方法,基于SPSS因子分析和判别分析的祖母绿产地溯源方法包括:获取不同产地祖母绿的化学成分数据,从获取的不同产地祖母绿的化学成分数据中提取不同产地的祖母绿中的微量元素及微量元素的含量;对得到的7组微量元素离子数据进行因子分析,利用线性回归分析对数据多重共线性进行预估;基于因子分析结果以及预估结果确定溯源变量;基于确定的溯源变量构建产地判别模型,利用构建的产地判别模型进行祖母绿产地溯源。本发明能够对不同产地祖母绿进行产地溯源,且溯源准确率高。且溯源准确率高。且溯源准确率高。


技术研发人员:陈全莉 鲍珮瑾 黄惠臻 高冉
受保护的技术使用者:中国地质大学(武汉)
技术研发日:2022.03.19
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-8708.html

最新回复(0)