对话圆代码CEO张朝明：做不跟ChatGPT对抗的企业大

来源：未知编辑：天选资讯时间：2023-06-13

　　通过统一的自然语言指令调用大量知识，ChatGPT 改变了人与 AI 交互的方式，并将进一步改变更多软件的交互模式和底层架构。

　　例如，现实生活中，各行各业都与海量的数据处理有关，比如把企业的季度营收数据填进报表中，记录证券市场交易数据和市场趋势波动，处理保单医疗图文数据等等，但将数据从非结构化的图文信息中抽取、整理出用户需要的信息，往往需要耗费相当的人力和时间。

　　近日，《连线》杂志创始主编 Kevin Kelly 在接受媒体采访时表示，他很认同一个观点，就是：在未来，人们需要放大自己身上 10% 的技能，因为剩下的 90% 将被 AI 取代。例如，在医疗领域中，AI 特别擅长搜索和分析，可以协助人类医生进行诊断。

　　业界对大模型的需求呈井喷之势。基础大模型的优势在于它的通用性，通过强大的图文理解能力和交互方式，目标在于追求最终的通用人工智能（AGI），但与此同时，通用大模型在满足阶段性的、细分场景下的 B 端需求上也体现出“牛刀小用”的短板，在工程优化、降低成本等方面有很大的提升空间。

　　对于这一问题，近日 AI 科技评论与深圳市圆代码互联网有限公司的 CEO 张朝明进行了探讨。

　　张朝明指出，今天的大模型有非常强的话语权，甚至可以决定一个生态的生死；从资金、技术和人才等角度体系思考，创业公司入场的门槛正在降低。小公司要参与大模型的浪潮，张朝明认为最大的机会还是在 To B 市场上。

　　“首先，不是去做一个跟 ChatGPT 对抗的大模型，而是聚焦私有化部署，做一个具备行业 Know-How 的企业大模型；第二，ChatGPT 给出的结果是对是错，需要交给专业的人用专业的知识去判断。”

　　比如保险行业中的核保，关于核保的规则往往很难在公开渠道中获取，这属于保险公司的核心机密，我们只能通过在案例里去学习，因此也就存在不够精准的问题。大模型在专业知识领域大概只能做到百分之六七十的准确率，外行人看着可能觉得效果不错，但在内行人看来是无法使用的。

　　在行业里，95% 是一个生产标准。什么意思？也就是说做到 80% 也好、70% 也好，对生产环节而言没有区别。行业的判断标准之所以是 95%，是因为人的准确率大概在 92% 到 98% 之间，95% 刚好是个中位数，差额的几个点默认是人为也会出现的损失，这是一个容忍度的问题。而越在生产环节，对模型效果准确率的容忍度越低。

　　我们能看到的一个趋势是，大模型在 To C 方面很难超过 ChatGPT，这是由 To C 特殊的环境决定的，当一家中国企业做出一个 ChatGPT 后、美国人会不会使用，这是个很重要的问题，这也从语料、用户数量等等方面决定了国内厂商的模型很难达到 ChatGPT 的水准，但中国人自己使用是可以实现的。我认为 ChatGPT 和以前的淘宝搜索等不一样的地方在于，它是跨语言的。以前在淘宝上想使用英文搜索、或在谷歌上使用中文，都存在语言问题，但 ChatGPT 很好地处理了跨语言的问题。

　　首先，不做一个跟 ChatGPT 对抗的大模型，我们看到的市场是在私有化部署上，具备行业 Know-How 能提供专业知识结果的企业大模型。私有化部署解决的是两个问题，一个是数据隐私的问题，这是私有化部署的核心，另一个则是专业性，所以这个大模型用户要自己训练；ChatGPT 给出的结果是对是错，需要通过人专业的知识去判断，且无法矫正数据的准确率，并不是将专业知识灌进去，就可以得到专业的结果，因此，企业也需要训练自己的大模型。

　　里面数据的填入是小模型更专业。所以这件事情需要大模型配合小模型来完成。AI 科技评论：大模型配合

　　从商业逻辑上看，在仅用小样本就能完成一个行业知识训练的情况下，使用几个亿、几十个亿的成本来训练行业知识的人、即便将这部分成本平摊到各个业务环节中，也肯定是赔钱的。核心的逻辑就在于，知识整理、储备整理和这个成本是多少？而这件事情过去很少有人去做。

　　而核心的知识来源一直没有解决。也就是说，无法使用大模型来指导工作，因为成本太高了。

　　为此，圆代码之所以能够极大地减少成本开支，是基于我们从小模型时代就基于自研技术、所提出的核心抽取模型。通过核心抽取模型所具备的复杂语义抽取能力，可实现用小样本解决构建知识图谱的成本问题。

　　PC 时代是操作系统为王，到互联网时代浏览器成为了入口、入口为王，再到移动互联网时代又是操作系统（iOS 和安卓）为王，发展路径十分清晰，非常简单的道理是、操作系统没有强势地位就会被剥削掉。

　　因此我们认为，大模型跟零代码的区别就在于，大模型一定是个基础设施，有非常强的话语天选权，甚至可以决定一个生态的生死。我们想做的就是一套操作系统，任何玩家都可以用，我们把这套东西提供给企业，企业的人不需要会编程，而是只要会业务、把他的业务数据放到这套东西上就可以使用，任何领域的人都能非常简单地完成相应的工作，这是我们对这套“操作系统”的定义。

　　赔钱的人从原来的公司变成了 AI 公司，这是一个核心的问题，只有解决了它，AI 公司才能够是赚钱的。

　　解决问题的关键在于，怎么通过使用我们所提供的这套操作系统，让 AI 公司仅需要用 1 个模型工程师和算法就能把问题解决到 95% ，这才是有价值的。

　　以医疗为例，圆代码做的主要对病例报告的解析，但我们不对影像报告的内容做解读，而是解析影像报告解读出来的文字内容。这部分需求放在医疗行业里，很难看到它的生态，但保险行业对这部分内容的需求很大。用大模型做医疗的事情，把保险行业的需求平移、解决保险人员对报告数据的需求问题。

　　跟银行不同，银行大多数的数据都是结构化的，因此在日常的运转过程中对数据解析的需求并不大。银行在正常运转下，使用 IT 软件就能处理 90% 左右的事情，剩下 10% 是由人在处理，天选团队例如贷款审核等等，因此报告解析在对应的工作内容体量中非常少。而保险公司从一开始就是人为处理的事情居多，其业务内容中人为占比达到 90% ，AI 只支持 10% 的信息存取、数据的流转，根本原因是，二者的数据源不一样，一个就是结构化的数据，

　　当 AI 巨大变革来临，或许银行在审核环节也会有变革，但其绝没有 AI 对保险行业的影响直接。

　　当今天保险行业需要处理医疗的数据内容，通过人工来处理报告的数据输入、往往需要花费一天时间，结构化成本非常高；而借助我们的模型和平台、可以实现秒级速度迅速完成资料的结构化，这就是我们的技术实力

　　举个简单的例子，医疗行业的体验报告样式各不相同，当使用 AI 模型对体检报告进行结构化处理，几万篇同一模板格式的报告数据、对圆代码的技术研究作用不大。当体检报告样式有十几万种，要将这十几万种报告都找齐、再进行模型识别训练，这件事也并不现实。此外，如保险等此类隐私数据，我们也很难通过网络途径获取，隐私数据禁止买卖，上述均是十分现实的情况，如果问题无法解决，很难进行后面的训练。

　　对此，圆代码的思路是，在找不到一千份、一万份前提下，我们能否找到二十份小样本数据，基于二十份数据加上我们的技术，将适用于整个行业的模型训练出来，把图文信息转化为结构化数据，走自研底层技术、用更少的数据达到更好效果的模式。

　　今天小公司想做大模型创业，我觉得其创业门槛相比小模型时代已经极大地降低了，但同时我们也要看到它最终能做成功的难度非常高。非常难的原因在于，首先一定需要有极强的科研能力，这对创业公司来说要在技术和人才上迅速拉平需要非常大的成本，这是第一点。

　　可以说，上述两个问题就已经把绝大部分的创业公司都杀掉了，所以我认为，当前创业公司已经很难能够跑出来，在这个纯技术的赛道上，窗口已经关闭了。

　　举个例子，做 AI 的公司把证券公司需要的数据给到证券公司，使用了它在 AI 上的能力来解决证券公司的人的需求，这叫做 AI 公司；而使用 AI 能力解决证券问题，体现的是公司在证券方面的建模和分析能力，这种我们称之为 AI +证券公司。大多数做 AI 公司会采用开源的解法来解决一个行业的具体问题，但它的核心能力是在金融建模上的能力，而并非 AI 建模上。

　　就任意一个疾病种类，用同一套技术去解决新的病情。这是商业模式的设计，而非技术的设计。也就是说，当你解决了数据源的问题，其实并没有解决别的问题。但在我们看来，大模型应该是一种基础技术，并不是说数据加模型的服务，就能够成为一个大模型。圆代码用大模型提供了一种数据处理的方式，最终也并不参与解决具体的行业问题。

上一篇：勤哲excel服务器无代码实现防汛物资管理系统
下一篇：csgo透视开箱怎么弄的？ csgo自定义透视开箱指令