第36章 算法封神!百分之一的碾压 (第2/3页)
陈默信了。因为除了“认识一些天才朋友”,他无法解释为什么一个产品出身的COO,能写出这种级别的算法代码。
“那……预训练模型呢?”另一个工程师问,“没有好的初始权重,再好的架构也白搭。”
“有。”林辰打开浏览器,输入系统提供的一个网址,“这是一个开源的客服领域预训练模型,训练数据包含五千万条对话,覆盖金融、电商、教育等十几个行业。我们可以直接拿过来,用我们的数据微调。”
网页打开,是一个英文的技术博客,最新一篇论文的链接。论文标题是《CPT: A Large-Scale Pre-trained Model for Customer Service》,作者来自斯坦福。模型权重开源,可以免费商用。
陈默点开论文,快速浏览摘要和方法部分,然后倒吸一口凉气。
“五千万条对话……Transformer-XL架构……三十亿参数……这,这比云图用的模型还大!”
“但我们可以用知识蒸馏的方法,把它压缩到适合我们线上部署的规模。”林辰说,“虽然会损失一些精度,但基础能力在,微调后应该能突破99%。”
“何止99%……”陈默的声音在发颤,“如果这个模型真像论文里说的那么强,我们微调好了,可能……可能能到99.5%。”
99.5%。
比云图的99%,高出0.5个百分点。
在AI领域,0.1%的差距就是一代。0.5%,是碾压。
会议室里,五个算法工程师的眼睛,同时亮起饿狼般的光。
“干不干?”林辰问。
“干!”五人异口同声。
“好。”林辰起身,“陈默,你带两个人,负责模型压缩和微调。另外两个人,按照我写的架构,把新模型搭起来。我负责协调算力资源——李总会批的。目标是,四十八小时内,新模型上线测试。”
“四十八小时?这不可能——”
“可能。”林辰打断他,“因为我们没时间了。三天后,是项目结项汇报。李总会邀请几个潜在客户来参观。我们要在那天,用新版本的‘星语’,现场演示。效果,必须是碾压级的。”
他看向每个人。
“这是最后一仗。打赢了,‘星语’翻身,咱们所有人,升职加薪。打输了……”他没说下去,但意思都懂。
“明白了。”陈默深吸一口气,“林总,我们拼了。”
“不是拼了。”林辰拍拍他的肩,“是必须赢。”
3
四十八小时后。
凌晨五点,星河科技机房。
GPU服务器群的轰鸣声震耳欲聋,机柜上的指示灯疯狂闪烁。散热系统的风量开到最大,但室内温度依然逼近三十度。陈默和两个工程师蹲在服务器前,眼睛死盯着监控屏幕。
模型训练,第九十七轮。
准确率:99.37%。
距离99.5%的目标,还差0.13个百分点。
“损失函数还在下降,但很慢了。”一个工程师哑着嗓子说,“可能到瓶颈了。”
“继续。”陈默说,“把学习率再调低一半,训练轮数加到一百二十轮。另外,把数据增强的强度提高,特别是那些长尾样本,多生成一些变体。”
“可时间……”
“时间我来抢。”林辰的声音从门口传来。
他走进机房,手里提着四杯咖啡,眼睛里的血丝比陈默还重。过去四十八小时,他睡了不到四小时,大部分时间在协调资源、解决阻塞、给团队打气。
“李总特批,把公司所有空闲的GPU算力都调给我们了。”林辰把咖啡分给大家,“另外,我从朋友那儿借了二十张A100,远程集群,已经接入。现在我们的总算力,是之前的四倍。”
陈默眼睛一亮:“那训练速度能提升三倍!一百二十轮,原来要八小时,现在三小时就够了!”
“所以,继续。”林辰说,“我要在上午九点前,看到准确率突破99.5%。”
“是!”
训练继续。
林辰走出机房,走到窗边。天还没亮,城市笼罩在深蓝色的黎明前黑暗中。远处的地平线泛起一丝极淡的鱼肚白,像一道微弱的希望。
他喝了一口咖啡,苦得皱眉。
四十八小时,不眠不休。整个算法组,整个“星语”团队,都在拼命。有人直接在行军床上睡着了,手里还抱着电脑。有人边哭边调参,因为压力太大。但没人放弃。
因为所有人都知道,这一仗,不能输。
手机震动,是苏雨晴发来的微信:“还在公司?”
林辰回复:“嗯,最后冲刺。今天上午汇报,结束了就能回家。”
“注意身体。我和孩子等你。”
“好。”
简单的对话,却让林辰心里一暖。这二十七天,他回家的次数屈指可数。苏雨晴没抱怨,只是每天发消息提醒他吃饭、睡觉。父母那边,她也安抚得很好。有她在,家里稳如磐石,他才能在前线拼命。
这就是他要守护的东西。
为了这个,他必须赢。
上午八点四十分。
机房的门猛地被推开。
陈默冲出来,头发凌乱,眼睛通红,但脸上是抑制不住的狂喜。
“林总!99.52%!准确率99.52%!”
林辰手里的咖啡杯晃了一下,滚烫的液体溅到手背上,但他没感觉。
“确认了?”
“确认了!测试集、验证集、线上影子流量,全部通过!特别是长尾问题,准确率从73%提升到91%!这已经不是优化了,这是质变!”
林辰闭上眼睛,长长地、深深地吸了一口气。
然后他睁开眼。
“部署。九点半的汇报,我要用新模型演示。”
“已经在部署了!十分钟后完成!”
4
上午九点二十五分,星河科技九楼大会议室。
会议室里坐满了人。李铭坐在主位,左手边是陈明远,右手边是几个林辰没见过的人——看穿着气质,应该是潜在客户。再往后,是公司所有高管、各业务线负责人。
气氛凝重。
因为所有人都知道,今天是“星语”重构项目的结项汇报。林辰立下的“一个月”军令状,今天是最后一天。成败,在此一举。
“林总怎么还没来?”陈明远看了眼手表,声音不大,但足够让所有人听见,“不会是……没准备好,不敢来了吧?”
几个客户代表交换了下眼神。
李铭没说话,只是端起茶杯,吹了吹浮沫。
会议室门被推开。
林辰走进来,身后跟着王海清和陈默。他换了身干净的西装,胡子刮了,头发整理过,但眼里的血丝和脸上的疲惫藏不住。不过,他的背挺得很直,脚步沉稳。
“抱歉,让各位久等了。”林辰走到演示台前,插上U盘,“刚刚在做一个最后的测试,耽误了几分钟。”
“什么测试这么重要,连汇报时间都能耽误?”陈明远问,语气里的嘲讽毫不掩饰。
“一个能决定‘星语’生死的测试。”林辰打开PPT,第一页是巨大的标题:《“星语”客服系统重构结项汇报——从濒死到新生》。
他没看陈明远,目光扫过全场,最后落在李铭脸上。
“李总,各位领导,各位客户朋友。过去一个月,我们做了件事:把‘星语’这个三年前设计、已经病入膏肓的系统,从头到脚重构了一遍。目标很明确:让它活过来,让它变得更好,让它有资格重新站上市场舞台。”
他切到下一页,是数据对比图。
“重构前,系统可用性99.3%,平均响应时间380毫秒,核心算法准确率97.2%。重构后,可用性99.97%,响应时间120毫秒,算法准确率……”
他停顿了一下。
会议室里所有人屏住呼吸。
陈明远嘴角挂着一丝冷笑,等着看林辰报出一个“不错但不够”的数字。
“算法准确率,”林辰缓缓说,“99.52%。”
死一般的寂静。
然后,嗡的一声,会议室炸了。
“多少?!”
“99.5%?!”
“这不可能!云图也才99%!”
“林总,数据确认过吗?会不会是测试集有问题?”
林辰等议论声稍平,才开口:“数据经过三轮交叉验证,测试集、验证集、线上影子流量,全部确认。准确率99.52%,长尾问题准确率从73%提升到91%。这个数字,我负全责。”
他说“负全责”时,目光平静,但带着不容置疑的力量。
陈明远脸色变了,他猛地站起来:“林总,吹牛也要有个限度!99.5%的准确率,你知道这意味着什么吗?意味着我们的算法水平,已经超过了云图,超过了行业所有竞争对手!你觉得,在座的人会信吗?”
“所以我准备了演示。”林辰说,“陈默,接系统。”
陈默在笔记本电脑上操作了几下,会议室的投影切换到一个简洁的测试界面。左侧是输入框,右侧是系统回答区域。
“这是新版的‘星语’客服系统,搭载了刚刚训练完成的99.52%准确率模型。”林辰说,“现场,任
(本章未完,请点击下一页继续阅读)