第1190章 W+Deep+X
课程表的在线翻译目前并未有正式命名,虽然能用,但王卓还是希望能继续优化优化。
至少不能成为网友吐槽的素材吧?
不过余凯余院长倒是有些不同意见。
“你的意思让我们的用户自己去纠错?”
“是的”
余凯点头回道。
这也是他急着让大老板过来看演示的原因。
“课程表在国内拥有数千万高学历用户,其中在校生就有两三千万,这个资源我们完全可以利用起来”
“首先他们的四六级、考研以及外文文献阅读、摘要等对翻译都是有需求的”
“比如他们在使用我们的翻译时,发现有明显的语义错误,可以进行标注反馈,我们会根据反馈信息进行积分或者实物奖励”
“另外一些专业院系学生还能贡献学科专属术语比如医学、计算机、法律等,这对完善我们deep思考逻辑是有非常大的帮助”
“嗯,这个是我没想到的”
王卓闻言,轻轻点了点头。
这一块确实被他忽略了。
刚才他想到的还是基于传统的调校优化,完全没有想到可以利用课程表的本身的资源进行补充。
要知道课程表现在就是在校大学生的必备软件,无论是查课还是社交亦或者兴趣组,在校园里的使用频率明显要高于微信。
同样,高校用户的课程表App是可以直接点外卖、扫码支付的,甚至还能直接调用电子图书馆。
将在线翻译功能镶嵌到课程表App,大概率是会受到学生们的欢迎的。
因为英译中的单词翻译是没有问题的,有问题的主要是长句、短句的语义容易搞混,这对这些高校大学生们来说,其实是很容易进行纠正的。
另外中译英虽然不能彻底得到解决,但总比现在的状况要好。
而且在线翻译天然就适配课程表的“求知”、“电子图书馆”业务板块。
“求知”???
王卓又找到了一个“富贵点”
“啥?”
余凯震惊了!!!
“我说可不可以将课程表的‘求知’板块囊括到在线翻译里面?”
王卓拿起了一支香烟,想到余院长不抽烟,随即又塞回到了烟盒。
“我们现在的‘求知’模块主要是分区运营,那会不会有同样的问题或者类似的问题呢?”
“我觉得是有的,比如我在申商问了一个关于‘考研英语中的虚拟语气在从句里的时态规则?’,同样这个问题也有可能出现在交大或者其他院校的‘求知’问题里,那么我们可以不可以通过内部的数据库进行自动回答?”
余凯:......
“我觉得逻辑上是可以的,这个就有点类似于咱们的统计机器翻译”
“我们需要提前统计归类好各种问题答案,然后根据提问者进行系统反馈,或许很多答案不一致,但我们可以根据deep思考分出哪些答案是标准答案或者说接近标准答案?”
“这个应该能做到吧?”
王卓看向有些呆滞的余院长。
“可以”
余凯深深地看了老板一眼。
谁说老板不懂技术?
目前课程表研究院的在线翻译是基于LStm架构展开的,根据课程表庞大的GpU算力,可以同时支持3条主任务线运营。
再多就不行了。
不是算力不行,而是在LStm架构内无法同时进行太多的任务线,除非市面上出现更优的架构算法。
当然,课程表自身也在摸索,只不过方向倒是有不少,但能跑通逻辑的暂时还没出现。
按照王总的逻辑推断,其实电子图书馆也是可以加入进来的。
那样在线翻译就不再是一款单纯的翻译软件,而是“翻译”+“问答”+“摘要”的学习综合机器模型。
当然,它只能够根据数据库的问题进行整理回答,无法自主作答,数据库里没有收录的答案,他是回答不了的。
当余凯把电子图书馆也加入进去的想法说出来后,王卓似乎是摸到了通用大模型的初级概念了。
“可以,那就把电子图书馆的数据也加入进去”
“嗯,回头我这边让人提交一份打通数据的报告上去,最快一个月就可以选几所高校进行内测”
“那行,需要总部提供什么资源直接说”
“嗯,我会的”
余凯笑着点了点头。
从张江离开已经是下午三点了。
上午在课程表人工智能研究院转了一上午,中午在食堂解决了午饭又去了张量实验室。
相比人工智能研究院,张量实验室主要是进行理论方向的研发。
简单说就是张量实验室的研究成果几乎很难申请专利,因为他们从事的是智力研发,即便有成果也会是架构、框架类的大成果。
但课程表的人工智能研究院则可以根据张量实验室的研发成果进行路径转化。
比如LStm(长短期记忆网络)架构?
LStm架构并非是课程表提出的,而是德国慕尼黑大学在97年正式提出。
但张量实验室可以根据LStm的大框架进行优化,而这种优化想要申请专利就需要搭配软件或是硬件的具体技术方案。
比如课程表的人工智能研究院可以根据优化后的LStm框架延伸出了具体路径,这个就可以申请专利了。
也就是说,人工智能研究院基于LStm框架做出来了的w+deep+技术方向,这就是一条技术专利路径。
当然了,这个专利不同于AR方向的专利池。
AI的专利主要是防御性为主,因为无论是w还是deep都属于公有领域的技术,只不过现在是课程表这边将两者混在了一起,如果这种专利你拿去起诉别人?
那你以后就等着被别人盯着起诉吧?
所以现阶段AI方向的所有专利都只能作为防御性专利,甚至还会对其他开发者进行开源。
只要你提出来的路径确实能够走远,那么这条路径上的开发者就会继续往下走,只要他们能够搞出有意义的东西,那么你就可以直接使用了。
因为他是沿着你的开发路径走下去的,如果他不让你用,你完全可以禁止他使用你的技术框架。
而这就是防御性专利最大的用处。
课程表研究院也是如此。
谁也不敢肯定自己的路径是否正确,在摸索阶段只能主动公布自己的研发方向。
当然了,这个主动公布自己的研发方向不是没有成果前就公布,而是已经产生了一定的成果了。
比如这次的w+deep+x技术路径,在实际运行没有问题后,课程表就会将这套技术方案对外公开,所有研发机构都可以合规使用这套技术框架。
他们可能会做出w+deep+电商推荐?
或者w+deep+搜索?
反正只要你是通过这条路径的产生了成果,后面课程表就可以通过交叉授权直接使用。