EBET易博官网行业大模型卷卷更健康

  新闻资讯     |      2023-06-26 03:09

  本周,一位互联网人士分享了一个小故事几天前,他曾遇见一帮创业青年,在交流的过程中,对方告诉他,他们搜集了一大堆修车相关的案例和知识,想问问他能不能提供通用大模型的能力基础,来帮助他们去训练一个修车行业的大模型出来,以便让中国1000万修车工都能拥有20年老师傅的功力。

  “未来大模型这个产业怎么发展,我觉得还得往垂直化、产业化、企业化,甚至个人化发展

  “全国都在大炼行业大模型”,“现在只要是上市公司或规模稍微大一点的企业,他们都会有

  一定需要构建行业的预训练模型才能解决,也即打造一个行业大模型。李景秋发现,尤其是教育、金融、能源方向,很多有行业数据和场景积累的龙头企业都希望和大厂合作,构建行业大模型,并进一步孵化行业应用,广泛去服务上下游相关企业。

  中科深智CTO宋健认为,不管是从一些行业对专业知识的要求,还是从安全性、成本和效率问题来看,行业大模型都是必然存在的

  。宋健透露,之前,一套好用或者可以达标的数字人后端对话系统,对他们来说一直是道难题,数字人一般只能做到有一套简单的问答系统,很难满足用户需求。例如在电商直播间,用户能问的问题和问法基本是被限制的,一旦说法发生变化,后端的问答系统可能就无法匹配。但大模型强大的语义理解能力为这个问题提供了解决方案,让用户可以从“和一个很傻的白痴在聊天”,进化到“可能跟一个比较聪明的正常人在聊天”。

  “这个区别是非常大的。”宋健告诉数智前线月份开始做相关准备,并在5月正式推出面向虚拟人这一垂直领域的行业大模型数智姜尚的原因。中科深智是国内一家虚拟人公司,有数据显示,其虚拟主播产品已服务超2000家客户,占据主流电商平台虚拟主播近70%的份额。

  中国移动也正在研发和内测的一个客服的行业模型,未来可能会对外提供,带头人是中国移动首席科学家冯俊兰

  而在此前的5月29日,中国联通研究院副院长、首席科学家唐雄燕也曾向外透露,中国联通正在打造一个通用的、可适用于各网络体系的通信大模型

  安防行业“海大宇”三巨头中的宇视科技在5月推了宇视AIoT行业大模型“梧桐”,并在此次安博会上展示了该行业大模型在Vlog等场景的应用。它可将景区专业设备抓拍的游客游览视频,自动生成vlog,配上文字和表情包。

  多模态生物识别企业熵基科技设了一个自研大模型及技术专区,专门展示自己涵盖了140亿、70亿、13亿等多个参数规模版本在内的BioCV大模型矩阵;人工智能企业联汇科技也用了大量笔墨介绍自己百亿级参数的视觉语言大模型OmModel,并表示下半年还会有一个V3(OmModel V3 )版本的发布;算力提供商算能则专门用了一个位置,来展示其与算法合作伙伴千视通合作推出的AI大模型训推一体机,并将应用场景定位在了智慧网点、智慧职场、智慧巡检、风控监督。

  在对比了市场上的各类开源和闭源大模型的使用效果及成本后,云蝠智能最终采用了“自研小模型+开源大模型+垂直语料

  “百度文心一言,以及其他的一些模型,我们也都在用,只是用的地方不太一样。”中科深智CTO宋健告诉数智前线,在一些实时性、专业性以及数据安全性等要求较高的场景,例如虚拟助播,他们一般会用上自己自研行业大模型,但在一些通用场景,也会用到文心一言或其他大模型。

  “但就现阶段而言,你也不能对某个大模型依赖过重,毕竟战局还没有最后确认下来。”魏佳星强调,这就好比10年前安卓、塞班、黑莓等一堆底层操作系统厂商在干架,一旦某家企业对某个操作系统过于依赖,后期它的方案又长期跟不上迭代,这家企业就会吃亏。

  上述熵基科技的人士也透露,他们自研的大模型参数目前会相对小一点,但其会将基于开源大模型微调的模型作为老师或参照物,在对比学习中持续进步,避免对开源大模型形成过度依赖,且最终落到产品里面的,都会是他们的自研大模型。

  上述熵基科技的人士告诉数智前线,他们目前在探索落地上都还是项目制的,比如他们正和一家医院一起,用自研大模型,做一个导诊台的问询机器人,但现在具体的成熟产品还没有,“还在测”。而在2023安博会上,数智前线发现,现场强调了自己的大模型能力的企业,也大多只展示了他们的大模型技术或相关应用场景的Demo。

  百度智能云AI平台副总经理李景秋则表示,现在来找到他们做行业大模型的,都是行业内的龙头,百度虽然在19年就和浦发银行、国家电网一起推出了金融、能源行业大模型(非生成式),且目前已有11个行业大模型(非生成式)的输出,但具体到最新的生成式行业大模型的应用落地上,还得等几个月时间,预计会在今年之内实现。

  EBET易博

  “谁能在具备社会刚需的应用场景落地,谁就能最先形成自我造血的良性循环。”“我们首先要把目前已经达到的能力,尽快去落地,其次则是在语言模型的基础上去做多模态的扩充。”宋健告诉数智前线,这是他们现阶段最优先级要解决的两大问题。为此,他们最近已经在将一款基于自研大模型的产品虚拟助播进行市场推广。据介绍,基于自有大语言模型GenSense数智姜尚,虚拟助播将可以与主播及评论区进行顺畅对话,并保证快速抓屏回答问题、反馈低延时和高识别准确率。

  不过,宋健也发现,在行业大模型落地的过程中,仍然有不少困难和挑战需要去解决。其中最关键的就在于,当把大模型的能力落到某个实际场景的应用产品上时,由于没有参照,其实是并不好判断具体该如何用这些模型的

  例如在将虚拟助播这个产品用到电商直播场景时,由于每个直播间并不一样,卖的产品品类也不尽相同,进而导致促销方式也大为不同,因此往往需要精确挖掘每个直播间的需求,探索在成本可控的情况下,如何更好地让不同直播间的数据和语言大模型去做结合。“是利用微调,还是用外部数据,又或是通过插件的方式进行,这些东西在不同场景下,用法其实是不一样的,得到的结果也不一样。”宋健解释说。

  当然,行业大模型的故事其实才刚刚开始。各行各业的玩家们,都对它寄予了不小的期望。

  宋健所在的数字人行业,寄希望于大模型能够让数字人成功迈入下一阶段,即变得具有成长性、全面个性化,而不是像以前一样“千篇一律”。而魏佳星认为,大模型短期内有望提高智能客户的智能度,并提高增强其事后的BI能力,长期则有可能形成完全基于生成式的AI智能客服。更多的人,希望它能赋能工业质检、医疗导诊、教学等诸多更广泛的场景。

  从逻辑上讲,行业大模型一定会是在精度相对较低、容错率较高的行业先引用,再到精度要求高的地方去