科研动态

国科大博士生导师纪力强研究组在生物智能识别研究领域取得进展

  •   随着人工智能技术的发展及生物图像数据的快速积累,利用深度学习技术与物种图像大数据构建生物自动识别模型已经成为生物多样性领域重要的研究方向之一。但是,仅基于图像(image-only)的深度学习技术很难突破因物种图像数量分布不均衡及物种外观形态相似引起的模型性能瓶颈。生物多样性信息学研究组针对这一研究难题,充分考虑物种识别与普通物品图像识别之间差异,提出以物种分布数据和图像数据为基础,构建生态位特征与图像特征相结合的联合深度学习模型NicheNet。

      NicheNet采用生态位模型求解物种分布的先验概率,然后利用ResNet深度学习方法对特定地点采集的图像进行图像识别。假设S为物种集合,且 s=1,…,S.对于带有采集地信息(x,y)的输入的图像I,其被识别为物种s的概率可以定义为:

      随着人工智能技术的发展及生物图像数据的快速积累,利用深度学习技术与物种图像大数据构建生物自动识别模型已经成为生物多样性领域重要的研究方向之一。但是,仅基于图像(image-only)的深度学习技术很难突破因物种图像数量分布不均衡及物种外观形态相似引起的模型性能瓶颈。生物多样性信息学研究组针对这一研究难题,充分考虑物种识别与普通物品图像识别之间差异,提出以物种分布数据和图像数据为基础,构建生态位特征与图像特征相结合的联合深度学习模型NicheNet。

      NicheNet采用生态位模型求解物种分布的先验概率,然后利用ResNet深度学习方法对特定地点采集的图像进行图像识别。假设S为物种集合,且 s=1,…,S.对于带有采集地信息(x,y)的输入的图像I,其被识别为物种s的概率可以定义为:

    NicheNet联合模型框架

    NicheNet与Image-only模型在识别不同物种的F1-Score指标比较
    (a)ResNet和NicheNet在不同物种上的F1-Score都随着图像数量增多而增加;后者的F1-Score曲线基本上都在前者上方,统计表明NicheNet对ResNet的提升具有显著性,平均提升15.3%,T检验显著:p-value: 3.052e-16 < 0.001。(b)NicheNet的F1-Score增长累积曲线:50%的增长量来自12.5%的图像,反映NicheNet在较少图像数据上的识别性能优异。

    (a)两种模型在62个物种上的邻近种错误率的差异:NicheNet显著降低了image-only模型的邻近种错误率,平均减少8.5%,T检验显著(p-value= 6.476e-08 < 0.001)。(b)两种模型的邻近属错误率:NicheNet降低了image-only模型的邻近属错误率,相比邻近种错误率其下降的幅度较小,平均减少4.4%,但T检验表明依然显著(p-value=0.0012 < 0.01)。

    责编 :脱畅