螺旋矩阵细胞分割算法获得国际AI竞赛金牌!
在刚刚结束的Kaggle AI挑战赛Sartorius – Cell InstanceSegmentation中,螺旋矩阵AI实验室联合悦智AI实验室,在全球1500多只队伍中突出重围,获第10名 Top0.6%!与英伟达(NVIDIA)、中科院等数据科学家共同摘取最高奖项金牌。


关于螺旋矩阵公司
关于螺旋矩阵公司
山东螺旋矩阵公司专注于利用外周血进行多组学癌症筛查。多组学癌症筛查是癌症早筛技术研发的最前沿,也是国际公认的未来发展趋势。主要原理是通过对基因组、转录组、蛋白组、代谢组、以及影像组数据进行整合分析,寻找提示癌症的病变信息。此前单一组学往往只能提供单一维度的信息,而多组学联用可以获得对肿瘤多维度立体的认识,不同层次相互补足,进而提高整体的灵敏度和准确度.
螺旋矩阵创始人王正博士是山东医学会泌尿外科分会青年委员,曾主导山东大学多组学肾肿瘤筛查等项目, 深耕肾癌治疗10余年,荣获2020年山东医学科技奖成果推广应用奖。王正认为“通过机器学习技术对基因组、蛋白组、表观遗传组、代谢组等多维数据的分析,是泛癌筛查极具潜力的途径。”螺旋矩阵与山东第一医科大学附属省立医院、山东大学等机构和院校展开多组学癌症筛查的合作研究。相关产品正在进行临床实验,目前对多种肿瘤的特异性和敏感度已超过常用肿瘤标志物。
螺旋矩阵多组学分析平台,能对主流机器学习模型,如LDA、ANN、SVM、DeepForest、XGBoost、LightBoost、Deep Neural Network等,自动调节参数筛选高性能模型、模型组,提供不同场景下最优机器学习解决方案。自主研发的Adaboost-SC算法可在UCI公开数据集下轻松超越XGBoost等主流工业算法。
携手悦智AI
多组学分析平台需要强大的计算设备支撑。螺旋矩阵在创业之初即拟定 腾云悦智 的维鹰云(智能运维)产品作为长期合作伙伴,以解决产品使用过程中,众多机器在运维上的问题。本次竞赛中螺旋矩阵AI团队与悦智AI实验室双方结合不同业务场景算法的优劣点,跨界合作共同改进算法,最终取得了优异成绩。

竞赛的意义
Kaggle 是Google旗下全球最大的AI竞赛平台。本次竞赛项目是寻求对神经元细胞高精度的分割解决方案,以辅助神经系统疾病新的有效药物发现。在多组学领域属于影像组学内容。神经系统疾病,包括脑瘤、阿尔兹海默症等,是全球死亡和残疾的重要原因。然而我们往往很难量化不同药物及治疗对这类疾病的反应,目前的主要评估手段是通过显微镜直接观察神经元细胞。但困难是在显微图像中分割单个神经元细胞具有挑战性且耗时。如果能在AI的帮助下对这些细胞进行准确分割,就可以辅助新的有效药物发现,以治疗数百万患有这些疾病的人。

解决方案
现有图像分割技术方案对神经元细胞的准确性较差,在针对细胞分隔的研究中,神经母细胞瘤细胞系 SH-SY5Y 在测试的八种不同癌细胞类型中始终表现出最低的精准度。这可能和神经元细胞具有非常独特的、不规则形态有关。非常独特、不规则和凹形的神经元细胞形态,每个细胞的位置近乎随机。
为了解决以上困难我们采取了多种技术方案,其中优胜关键点:

1. 模型组搜索,利用多显卡多机器的高性能运算中心强大算力,自动搜索U-net 、unet++ 、miniseg、 highresnet 、 fcn、Mask R-CNN等图像分割算法的baseline,将模型组锁定为Mask R-CNN。
2. 尝试了各种对图像的预处理和增强情况下的baseline变化,使用高斯差分方法进行斑点检测,使用 90 度随机旋转等。
3. 自动超参数,采用改进的遗传算法对图像尺寸等参数进行超参搜索,找到最优参。
4. 多层分类处理,预训练时使用一分类方法,让预训练模型更加关注Mask,Fineture时用三分类处理,让模型关注到不同类别的细胞。
5. 使用官方非比赛数据Livecell数据集进行训练模型,半监督训练和迁移学习,对无标注数据进行标签推断,作为半监督学习的数据。
6. 自适应多层后处理,动态调整不同类型细胞的Mask评分阈值,自动化纠正重叠Mask,借鉴强化学习思想筛选Mask像素值。

