![地球科学中的大数据分析与挖掘算法手册](https://wfqqreader-1252317822.image.myqcloud.com/cover/574/33783574/b_33783574.jpg)
上QQ阅读APP看书,第一时间看更新
1.1.7 地球科学应用案例
以一个简单的林火风险预测为例,从一幅遥感影像中可以提取到植被的覆盖度类型,从空间数据库中查取过去一年中该地区的降水量,由数字高程模型(Digital Elevation Model,DEM)提取该地区的坡度图,应用关联规则算法得出发生山火的概率[10]。
首先,对已经得到的属性数据进行离散化处理,各属性的取值范围为植被覆盖度V[0,100]、坡度S[0,90]、降水量R[0,100]、山火发生概率F[1,10]。四维属性值的分割见表1-3~表1-6。
表1-3 植被覆盖度属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/3.jpg?sign=1739300139-hB1EMuMmJ7MzGEbvoXzIlghjMIcdJnYd-0-a0d633dc8d528119c5b5373c1e615320)
表1-4 坡度属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/4.jpg?sign=1739300139-vTqwv71hC7y4zGmKtZGIXTD68DBoznn4-0-312488989cc7e8af5188818946346f5a)
表1-5 降水量属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/5.jpg?sign=1739300139-Lfs0ncMiiXp5IuaW9AEvmXU3nFRJoE0M-0-c35730e837be28f2aa6ed8312bfabe56)
表1-6 山火发生概率属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/6.jpg?sign=1739300139-eSeP1pO0JbwdOnUqWVbR3zt9XjI3ixNU-0-8a4aa93a39580c2157c8197d979fe74c)
为了将关联规则用于遥感图像数据这类量化数据,首先应该将量化数据离散化,即需将图像数据转化为事务数据库的形式,事务数据库一般由事务的标识符和事务项集组成,在遥感图像中,每一个像素都代表一个事务,表1-7为图像数据转化为事务数据库形式的示例。
表1-7 事务数据库形式
![47855-00-041-1.jpg](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/47855-00-041-1.jpg?sign=1739300139-Une4uCt8T5FZgRNLdFB1Ouw0zo3BbQcm-0-e3dfbcd6e695e6d441fdc77d261a640d)
假设最小支持度为50%,最小置信度为60%。经过属性分割的所有块将成为候选项集,分别计算它们在60 000次交易中出现的次数。表1-8为计算后的四维关联规则。
表1-8 四维关联规则
![47855-00-042-1.jpg](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/47855-00-042-1.jpg?sign=1739300139-LCVNVlIq4N5Z1qUTJMZNtBXce8wxz0Cg-0-c311205078e70b0d5cdca7b9e6aa0165)
从上述的例子来看,坡度高、降水量多容易发生山火;坡度低、降雨量低、植被覆盖率低的地区,发生山火的概率不是很大;对于植被覆盖率比较大、坡度大于35°、上一年平均降水量小于64 cm的地区,在空气干燥季节尤其要引起注意。