工博文学
首页 > 其他 > 学校里用的ai智能防霸凌系统有哪些版本呢 >

第35章 神经网络

章节目录

所以,齐凡等人很头疼。他们需要在保证准确率的同时,又得精简算法,以便降低运算量。

在经过多次的失败尝试之后,齐凡大胆提出设想--不再将符号识别当成分类任务,而是应该当成回归任务。

所谓的回归,其与分类的本质在于:分类是预测结果集合中的一个值,而回归则是输出一个预测数值。

回归适合的是类似波士顿房价预测那种,预测一个变化的值,而不是数字识别这种,预测一个数字。因为数值是变化的,但是数字再怎么变,也跳不出0~9的范畴。

于是齐凡转换思路。他提出不再输出一个预测的符号,而是输出每个符号对应的概率。这样一来,就把分类任务变成了回归任务。

就好比,原先模型预测的结果是:0~9这几个数字。现在模型预测的结果是0~9各自对应的概率。最终的结果可取概率最大的那个数字。

在几人连着熬了几晚后,模型确实可行,无论是复杂度还是计算量都大大降低了。可错误率却是一言难尽,达到了可怕的80%。

80%!真的是牵一条华国田园犬过来训练下,都不至于会有如此之高的错误率。

这个结果不知道是不是因为张开的大嘴巴,很快不胫而走。于是新的表情包诞生了。

四个人旁边被ps了一条华国田园犬,小白板上ps了“80%”的图标。底下是一行小字--四名金大学子与狗的终极pk。

齐凡也曾幻想过自己有一天学术有成,金陵日报来采访自己。可不曾想自己会以这种方式出名。

齐凡四人在食堂吃饭的时候,不乏有人路过对他们指指点点。对此四人倒也懒得去理会。因为他们如今脑子里都是比赛。

那80%的错误率就如一座大山,他们就像手拿锄头的愚公。望山兴叹,一筹莫展。

几天后又是齐凡站了出来。

他想到了先对各种符号做分类预处理。将数字、标点、英文分为三大类,第一步先对这三大类做分类任务。相当于先让模型去区分一个符号,到底是属于数字还是标点,亦或者是英文。

随后再针对三大类各自训练一个专用模型。

数字的模型仅用来识别数字,标点的模型仅用来是被标点,英文的模型仅用来识别英文。

照着这个思路经过几天熬夜后。数字和标点的错误率降到了15%,因为数字和标点种类最少最好识别。可英文就尴尬了,因为有26个字母。英文的错误率依然高达60%。

章节目录
书友推荐: 谍云迷踪 战锤:孝出强大 美漫:蝙蝠侠的骗术师 西游:我能分解世间万物 纵横诸天从曼陀山庄开始 星辰大远航 道主有点咸 南洋:吴宋崛起 我以扭曲恋爱拯救病态少女 从铁衣功开始肉身成圣 火影:从罗杰船上归来的漩涡鸣人 沸腾时代 帝皇在上 黑暗之魂,但是碇真嗣 国术!大宗师 刚穿越成超人,被养父母上交国家 离婚后的我开始转运了 从霍格沃茨开始的符文法师 恐怖诸天:我直接拜酆都黑律! 一夕千悟,从杂役弟子开始