如何实现从算法多元化到算法优化(算法误报怎么办)
前情:某一天,天选打工人小极收到了客户发来的消息……
客户:你们算法效果不行啊!这识别出来的确定是火焰?
小极:这确实有点像“火焰”……在实际应用中,算法确实会有一定的误报概率……
客户:那怎样尽快修复算法?我希望在这个场景下不要再出现误报了!
小极:别急,您可以直接使用我们的「自训练工具」,只需采集一些这个场景下新的数据集进行标注,剩下的交给它,当天就能完成算法迭代!
后续:在完成数据标注后,客户利用「自训练工具」当天就完成了算法修复,几个月过去了,这个场景下的算法再也没出现误报……
其实,算法误报在实际项目场景中是一个很常见的问题。产生误报的客观原因也是多种多样,绝大部分是跟训练数据集有关,比如训练任务和目标任务的数据分布不一致、训练数据集过少等。
针对这样的问题,行业内通常会重新收集场景数据,采用回炉再造的方式人工进行算法迭代,来满足实际场景应用的需求。
但是这种方式路径较长、沟通繁琐,而且很多项目数据集敏感不能外传,这就导致算法迭代比较麻烦。
基于此,极视角自研了「自训练工具」来解决这些问题,为客户提供灵活、便捷、高效的算法迭代方式。
什么是自训练工具?自训练工具是一个面向极星平台私有化部署项目的算法快速迭代工具,为经典机器学习和深度学习提供了从数据处理、预置算法、模型训练、模型评估到模型管理的全链路服务,可以在保护项目数据隐私的前提下,缩短当前算法修复路径,减少客户与开发者沟通和参与的投入成本。
△ 自训练工具全链路服务
自训练工具是基于极视角提供的标准通用模型,叠加客户提供的特定场景下新的数据集,进行模型再训练,从而生产出效果更好的算法。
自训练工具的优势01 提供算法模型优化全链路服务,进行多轮模型训练,评估后替换原模型,实现模型优化。
02 提供3种数据接入方式(可以选择极星抓图数据、极星报警数据、本地上传数据)、2种数据清洗方式(包括智能去重、人工调参)和多版本数据集管理(包括训练数据集、测试数据集),灵活开放,操作方便。
△ 自训练工具数据服务
03 提供自训练工具私有化部署方式,现场安装自训练工具,解决网络环境约束以及敏感数据外传的问题。
04 使用生产环境的垂直场景数据集,自训练后的模型更精准适配实际场景,算法减少误报和漏报。
对客户来说,只需要采集一定的垂直场景数据集,无需额外投入专业人力,使用自训练工具便可提高算法准确率,轻松实现算法迭代。除去数据重新标注环节,自训练工具1天内即可完成算法模型优化,节省50%以上的算法优化迭代时间。
极星平台是基于极视角强大技术能力打造的AI应用开发及服务平台,致力于帮助企业客户低成本实现AI与业务的结合,快速完成AI能力的构建。
关于极星平台的更多技术亮点、如何为客户解决AI应用过程中的实际痛点、如何提升AI落地效率,敬请关注「极讲堂」栏目后续推出。(公众号:极视角)
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com