设为首页 - 加入收藏
广告 1000x90
您的当前位置:主页 > 资源 > 效果代码 > 正文

对话圆代码CEO张朝明:做不跟ChatGPT对抗的企业大

来源:未知 编辑:天选资讯 时间:2023-06-13

  通过统一的自然语言指令调用大量知识,ChatGPT 改变了人与 AI 交互的方式,并将进一步改变更多软件的交互模式和底层架构。

  例如,现实生活中,各行各业都与海量的数据处理有关,比如把企业的季度营收数据填进报表中,记录证券市场交易数据和市场趋势波动,处理保单医疗图文数据等等,但将数据从非结构化的图文信息中抽取、整理出用户需要的信息,往往需要耗费相当的人力和时间。

  近日,《连线》杂志创始主编 Kevin Kelly 在接受媒体采访时表示,他很认同一个观点,就是:在未来,人们需要放大自己身上 10% 的技能,因为剩下的 90% 将被 AI 取代。例如,在医疗领域中,AI 特别擅长搜索和分析,可以协助人类医生进行诊断。

  业界对大模型的需求呈井喷之势。基础大模型的优势在于它的通用性,通过强大的图文理解能力和交互方式,目标在于追求最终的通用人工智能(AGI),但与此同时,通用大模型在满足阶段性的、细分场景下的 B 端需求上也体现出“牛刀小用”的短板,在工程优化、降低成本等方面有很大的提升空间。

  对于这一问题,近日 AI 科技评论与深圳市圆代码互联网有限公司的 CEO 张朝明进行了探讨。

  张朝明指出,今天的大模型有非常强的话语权,甚至可以决定一个生态的生死;从资金、技术和人才等角度体系思考,创业公司入场的门槛正在降低。小公司要参与大模型的浪潮,张朝明认为最大的机会还是在 To B 市场上。

  “首先,不是去做一个跟 ChatGPT 对抗的大模型,而是聚焦私有化部署,做一个具备行业 Know-How 的企业大模型;第二,ChatGPT 给出的结果是对是错,需要交给专业的人用专业的知识去判断。”

  比如保险行业中的核保,关于核保的规则往往很难在公开渠道中获取,这属于保险公司的核心机密,我们只能通过在案例里去学习,因此也就存在不够精准的问题。大模型在专业知识领域大概只能做到百分之六七十的准确率,外行人看着可能觉得效果不错,但在内行人看来是无法使用的。

  在行业里,95% 是一个生产标准。什么意思?也就是说做到 80% 也好、70% 也好,对生产环节而言没有区别。行业的判断标准之所以是 95%,是因为人的准确率大概在 92% 到 98% 之间,95% 刚好是个中位数,差额的几个点默认是人为也会出现的损失,这是一个容忍度的问题。而越在生产环节,对模型效果准确率的容忍度越低。

  我们能看到的一个趋势是,大模型在 To C 方面很难超过 ChatGPT,这是由 To C 特殊的环境决定的,当一家中国企业做出一个 ChatGPT 后、美国人会不会使用,这是个很重要的问题,这也从语料、用户数量等等方面决定了国内厂商的模型很难达到 ChatGPT 的水准,但中国人自己使用是可以实现的。我认为 ChatGPT 和以前的淘宝搜索等不一样的地方在于,它是跨语言的。以前在淘宝上想使用英文搜索、或在谷歌上使用中文,都存在语言问题,但 ChatGPT 很好地处理了跨语言的问题。

  首先,不做一个跟 ChatGPT 对抗的大模型,我们看到的市场是在私有化部署上,具备行业 Know-How 能提供专业知识结果的企业大模型。私有化部署解决的是两个问题,一个是数据隐私的问题,这是私有化部署的核心,另一个则是专业性,所以这个大模型用户要自己训练;ChatGPT 给出的结果是对是错,需要通过人专业的知识去判断,且无法矫正数据的准确率,并不是将专业知识灌进去,就可以得到专业的结果,因此,企业也需要训练自己的大模型。

  里面数据的填入是小模型更专业。所以这件事情需要大模型配合小模型来完成。AI 科技评论:大模型配合

  从商业逻辑上看,在仅用小样本就能完成一个行业知识训练的情况下,使用几个亿、几十个亿的成本来训练行业知识的人、即便将这部分成本平摊到各个业务环节中,也肯定是赔钱的。核心的逻辑就在于,知识整理、储备整理和这个成本是多少?而这件事情过去很少有人去做。

  而核心的知识来源一直没有解决。也就是说,无法使用大模型来指导工作,因为成本太高了。

  为此,圆代码之所以能够极大地减少成本开支,是基于我们从小模型时代就基于自研技术、所提出的核心抽取模型。通过核心抽取模型所具备的复杂语义抽取能力,可实现用小样本解决构建知识图谱的成本问题。

  PC 时代是操作系统为王,到互联网时代浏览器成为了入口、入口为王,再到移动互联网时代又是操作系统(iOS 和安卓)为王,发展路径十分清晰,非常简单的道理是、操作系统没有强势地位就会被剥削掉。

  因此我们认为,大模型跟零代码的区别就在于,大模型一定是个基础设施,有非常强的话语天选权,甚至可以决定一个生态的生死。我们想做的就是一套操作系统,任何玩家都可以用,我们把这套东西提供给企业,企业的人不需要会编程,而是只要会业务、把他的业务数据放到这套东西上就可以使用,任何领域的人都能非常简单地完成相应的工作,这是我们对这套“操作系统”的定义。

  赔钱的人从原来的公司变成了 AI 公司,这是一个核心的问题,只有解决了它,AI 公司才能够是赚钱的。

  解决问题的关键在于,怎么通过使用我们所提供的这套操作系统,让 AI 公司仅需要用 1 个模型工程师和算法就能把问题解决到 95% ,这才是有价值的。

  以医疗为例,圆代码做的主要对病例报告的解析,但我们不对影像报告的内容做解读,而是解析影像报告解读出来的文字内容。这部分需求放在医疗行业里,很难看到它的生态,但保险行业对这部分内容的需求很大。用大模型做医疗的事情,把保险行业的需求平移、解决保险人员对报告数据的需求问题。

  跟银行不同,银行大多数的数据都是结构化的,因此在日常的运转过程中对数据解析的需求并不大。银行在正常运转下,使用 IT 软件就能处理 90% 左右的事情,剩下 10% 是由人在处理,天选团队例如贷款审核等等,因此报告解析在对应的工作内容体量中非常少。而保险公司从一开始就是人为处理的事情居多,其业务内容中人为占比达到 90% ,AI 只支持 10% 的信息存取、数据的流转,根本原因是,二者的数据源不一样,一个就是结构化的数据,

  当 AI 巨大变革来临,或许银行在审核环节也会有变革,但其绝没有 AI 对保险行业的影响直接。

  当今天保险行业需要处理医疗的数据内容,通过人工来处理报告的数据输入、往往需要花费一天时间,结构化成本非常高;而借助我们的模型和平台、可以实现秒级速度迅速完成资料的结构化,这就是我们的技术实力

  举个简单的例子,医疗行业的体验报告样式各不相同,当使用 AI 模型对体检报告进行结构化处理,几万篇同一模板格式的报告数据、对圆代码的技术研究作用不大。当体检报告样式有十几万种,要将这十几万种报告都找齐、再进行模型识别训练,这件事也并不现实。此外,如保险等此类隐私数据,我们也很难通过网络途径获取,隐私数据禁止买卖,上述均是十分现实的情况,如果问题无法解决,很难进行后面的训练。

  对此,圆代码的思路是,在找不到一千份、一万份前提下,我们能否找到二十份小样本数据,基于二十份数据加上我们的技术,将适用于整个行业的模型训练出来,把图文信息转化为结构化数据,走自研底层技术、用更少的数据达到更好效果的模式。

  今天小公司想做大模型创业,我觉得其创业门槛相比小模型时代已经极大地降低了,但同时我们也要看到它最终能做成功的难度非常高。非常难的原因在于,首先一定需要有极强的科研能力,这对创业公司来说要在技术和人才上迅速拉平需要非常大的成本,这是第一点。

  可以说,上述两个问题就已经把绝大部分的创业公司都杀掉了,所以我认为,当前创业公司已经很难能够跑出来,在这个纯技术的赛道上,窗口已经关闭了。

  举个例子,做 AI 的公司把证券公司需要的数据给到证券公司,使用了它在 AI 上的能力来解决证券公司的人的需求,这叫做 AI 公司;而使用 AI 能力解决证券问题,体现的是公司在证券方面的建模和分析能力,这种我们称之为 AI +证券公司。大多数做 AI 公司会采用开源的解法来解决一个行业的具体问题,但它的核心能力是在金融建模上的能力,而并非 AI 建模上。

  就任意一个疾病种类,用同一套技术去解决新的病情。这是商业模式的设计,而非技术的设计。也就是说,当你解决了数据源的问题,其实并没有解决别的问题。但在我们看来,大模型应该是一种基础技术,并不是说数据加模型的服务,就能够成为一个大模型。圆代码用大模型提供了一种数据处理的方式,最终也并不参与解决具体的行业问题。

相关推荐:

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片

织梦模板大全 dedecms.codesdq 联系QQ:121673232 邮箱:121673232@qq.com

Copyright © 2002-2011 DEDECMS. 织梦科技 版权所有 Power by DedeCms

Top