近日,中国移动举办了“2021年科技工作者日暨科技周——九天人工智能新技术论坛”,邀请来自中国移动、优秀人工智能企业、顶尖高校、国际标准化组织的业界专家分享AI基础技术及网络智能化领域的最新技术成果与行业动态,探讨未来AI技术发展趋势,促进产业数智化转型。九章云极DataCanvas资深架构师杨健受邀参加论坛,并发表了“新一代AutoML助力企业规模化建模”的精彩演讲。
九章云极DataCanvas资深架构师 杨健
近年来机器学习技术的应用价值显著,随之而来的数据瓶颈、算力瓶颈以及人才瓶颈日益凸显出来。随着人工智能的发展,数据和算力需求得以满足,数据科学人才培养却远远滞后于需求,最终爆发出人才培养周期长、速度慢等问题。资深架构师杨健在演讲中提到,AutoML技术正在迎来爆发性的增长,Gartner在2020年十大科技趋势中,将以AutoML为代表的AI普及化作为数据与分析领域的重要战略技术之一。
面对企业业务的新需求,九章云极DataCanvas提供AutoML自动化建模平台,构建神经网络架构搜索空间,运用超大规模空间搜索算法,结合高性能评估策略,达到全流程端到端的自动机器学习建模,提升建模效率与体验,让业务能快速构建和使用AI能力。
AutoML面临的挑战
杨健提到,AutoML虽然在不断发展,但也面临不均衡数据、概念漂移、模型泛化能力、大规模数据自动建模等诸多挑战。针对这些问题,在建模流程中DataCanvas自动机器学习平台运用AutoML自动化核心技术,使业务人员无需查看数据样本分布,全自动化的完成数据清洗、特征加工、模型筛选和超参数优化工作,自动处理不均衡问题。同时,引入半监督学习进一步提升模型的泛化能力,消除数据训练与预测的不确定性。平台支持分布式架构,提供高效的评估策略,降低建模的时间成本,从而使大规模数据实现AutoML。
九章云极DataCanvas以自主研发的“硬科技”立身,开源出国际领先的AutoML自动化模型算法和架构,拥有实现多样性机器学习任务和场景自动化开发的Hypernets、在全球顶级Kaggle竞赛中获得第一名的DeepTables等众多AutoML开源工具。并且根据UCI、Kaggle公开的数据集,其产品DataCanvas AutoML Toolkit(DAT)的模型准确度高于当前最先进的AutoML开源工具。
DataCanvas AutoML Toolkit(DAT)
随着不断变化的业务与市场需求,九章云极DataCanvas多年来在金融、通信、政府等众多行业实现场景应用,持续创新,坚持自主研发新技术、新产品,用标准化的AI平台产品覆盖更多的客户,助力各个行业的企业规模化建模,实现数智化升级。