大模型与大数据分析双向奔赴,率先实现商业化落地

数智前线   2023-07-28 11:12:18

大数据厂商正在加速挖掘已有产品与大模型结合的场景与机会。


(相关资料图)

文|任晓渔

编|徐鑫

不同于C端聊天对话场景里的应用热潮,业界意识到,大模型要落地到企业应用中需要解决安全、成本等多重挑战。而将大模型和企业内专有数据场景结合,可能会降低大模型落地门槛。

大数据厂商们已经嗅到了其中的机会。上个月,海外知名大数据企业Databricks与Snowflake都公布了大模型与自身平台能力结合的产品,用AI释放数据潜力。国内的厂商也动作频频,加速挖掘大语言模型在数据智能领域里的应用场景。

7月14日,国内大数据分析和指标平台供应商Kyligence(跬智信息)发布了 基于大语言模型技术打造的AI数智助理Kyligence Copilot ,引发业界关注。

据了解,这款智能助理基于此前的产品Kyligence Zen一站式指标平台能力打造,结合大语言模型能力,帮助用户通过自然语言对话完成围绕业务指标的分析和洞察,大幅提升业务人员用数的效率,赋能运营,加强组织内外部协同能力。

业界观察,目前Kyligence在数据智能领域已经形成了 “AI助理+指标平台+智能引擎”三驾马车 驱动的格局,有利于加速大模型在数据智能领域的落地应用闭环。

01

大数据领域或成大模型落地先行场景

中金研究部计算机行业首席分析师于钟海注意到一组数据。海外知名大数据厂商Databricks日前公布,过去30天有超过1500家客户在他们的平台上去训练Transformer模型,他们的GPU使用量每个月环比增长25%。

于钟海在2023年Kyligence用户大会上,引用这组数据目的就是提醒与会观众, 数据智能在当下大模型应用环节正日益受到业界的重视 。

一些业内人士认为,随着开源大模型能力的提升,算力成本的下降,未来对企业而言,数据的重要性可能会进一步提升,甚至将超过大模型。

于钟海指出,当下, 大数据厂商离数据更近 ,大模型与大数据相结合在赋能非技术人员,深化企业数字化转型以及优化商业决策等领域有明显的效果。加上大数据厂商们过往都有不错的AI能力沉淀, 大数据领域可能是大模型最先实现商业化领域之一 。

这些动向下,Kyligence基于自身指标平台Kyligence Zen产品叠加大模型的能力后打造的AI数智助理产品,Kyligence Copilot预览版一经发布,就受到了业内关注。

Kyligence CEO韩卿通过现场演示,向与会者介绍了AI 数智助理如何从成本管理和销售提升等二十多个指标,帮助管理者快速洞悉企业经营状况的变化。

例如,他问智能助理,“为什么最近4天的原材料损耗费用增加了?”几秒钟后,智能助手的答案里详细列出指标体系里与成本相关的一些指标变化。回答中提及,在河北廊坊的某两个分店在原材料损耗上有大幅增加。多回合的交互后,智能助手还可以生成非常清晰的影响相关指标的内容报告。

韩卿认为,一家企业有成千上万的指标,AI可以从效率、经营、协同这三个方面给组织的运营与管理带来变革。

首先, AI会提升数据分析效率,释放所有人的潜力 。每一个人都可以拥有一个AI数智助理去查找、推荐指标,用户可以基于相应的指标进行层层深入分析和探查,甚至可以用一句话来创建仪表盘。

第二, 以AI赋能运营释放管理的潜力 。有了AI数智助理,管理者可以获取到非常客观的数据和报告,它可以24小时随时且快速响应,还能帮助用户进行KPI评估,客观地给出整体的进展分析,同时还可以针对高风险的目标进行分析。

值得一提的是,AI数智助理的能力调用是基于指标平台Kyligence Zen进行的。Kyligence Zen可对组织内部的指标口径进行统一管理,不同部门和层级的人员都基于这一共同口径行动和决策。同时,每项指标都有具体的量化目标,用户可基于这些目标对业务数据进行多维度、全局性、有体系的监控和评估。

例如,用户能从业务目标出发,利用指标平台归因分析能力清晰看到指标变化的贡献因素,同时产品界面还会列出反向贡献因素。AI可基于指标逻辑,给出相比人工更为理性和客观的推断、分析和建议。

这对于管理者而言,只需简单交互就能层层追问出数据背后的业务运营情况,洞察企业运营和管理的细节,释放管理潜力,实现以数据来驱动组织的运营和管理。

第三, 以AI加强协同,释放组织的潜力 。用户可以通过智能助手对接不同的数据产品,整合不同的第三方软件和系统,以数据产品的形式加强组织间的协同。

总体来看,这款产品的能力重点并不只是交互对话带来的效率革命。 在它背后,指标平台对组织数据文化的培育和沉淀,基于业务目标用数据来驱动运营和管理实践,给组织运营和管理带来的潜力释放 ,都成为了它与市面上普通的大模型交互对话产品间的 重大能力区分 。

会上,Kyligence CTO李扬介绍了Kyligence Copilot智能助手的技术实现细节。 “我们不做通用大语言模型” ,李扬说,Kyligence会结合开源大语言模型和私有大语言模型,为用户打造专属于指标领域的语言。

据了解,Copilot执行指令的过程可分解为提问审查、指令理解、指令执行和数据解读四个环节。其中第三步指令执行需基于指标平台返回数据。在这个环节把目标领域限定在指标平台,基于已经治理过的数据能力,确保返回结果的准确性,使应用的稳定可靠度达到生产落地水平。

目前AI数智助理产品可基于微软Azure调用ChatGPT3.5大语言模型,也可接国内大语言模型产品或企业自有大模型,还可接入开源大语言模型。Kyligence产品非常重视数据安全指标,确保满足金融等行业客户对数据安全及隐私问题的需求。用户试用和购买指标平台 Kyligence Zen SaaS版本时可直接体验 到Kyligence Copilot。而嵌入式部署方案可以把Copilot的自然语言能力,通过 十行代码快速嵌入到客户开发的系统 里去。

02

“人人用数”,变革组织运营与管理

ChatGPT刚刚爆火时,韩卿给公司上下写过一封内部公开信。其中有三个表态。“第一, Not our game ,大语言模型本身不是我们的领域。 Be part of the game ,我们要参与到这个里面去,最后是 Be different 。我们要找到自己的赛场。”

Kyligence对新技术带来的变革以及自身能力有着清醒认知。随着Kyligence Copilot这款智能AI助理发布,Kyligence产品家族更加完整。韩卿透露,这款产品在 今年4月就开始有初始版本 ,他们花了几个月时间与不同行业的客户交流, 寻找和打磨自己的独特优势 。

实际上, Kyligence Copilot的价值,并非仅体现在单一的大语言模型助手应用 ,背后还离不开Kyligence两款成熟产品,指标平台Kyligence Zen和高性能的OLAP引擎Kyligence Enterprise的支撑。韩卿认为, 这也是他们在数据智能领域相较其他AI类产品的能力差异点 。

Kyligence CTO李扬给三款产品的关系画过一个等式,“ 人人用数 = Copilot+指标平台+OLAP引擎 ”。AI助理是拼图里最晚出现的产品,它也是“人人用数”拼图里非常重要的产品。李扬介绍,它通过自然语言交互,是一款零门槛的数据工具,解决了数据工具联通性最后一公里问题。在此之前的两款产品从数据语言统一和使用成本层面,给企业内用数据指导运营和管理奠定了基础。

企业级OLAP平台Kyligence Enterprise是这家公司创业之初就推出的拳头产品。2016年, Apache Kylin(一项领先的开源分布式OLAP分析引擎)核心团队从开源技术转向商业化,创立Kyligence 。在企业希望更好使用数据,用数据支撑企业运营和决策的大背景下,企业级 OLAP平台能支撑企业大规模高并发地访问数据,可为企业的关键业务提供对底层大规模数据的快速访问和分析能力 。

而一站式指标平台Kyligence Zen在2022年推出,提供企业级指标平台能力,可以协助用戶构建和管理企业内的统一指标体系,通过自动化分析提升业务使用数据的能力。知名分析机构Gartner在相关报告中也关注过这款产品的能力,Kyligence当选过Gartner 2022中国数据管理Cool Vendor,也是 入选Gartner 指标平台创新洞察报告的唯一中国厂商 。

Kyligence产品战略和市场布局是从广大企业和行业客户,在组织运营和变革中的使用数据的需求和痛点中打磨而来。

当企业视角转向内部管理,希望数据来驱动运营和管理时,通常遇到的障碍是,企业内数据量增多,大量的数据分散存在于不同的系统之间。同一个业务的数据,在不同部门和系统里可能会以不同的规格与口径存放。当需要用数据来判断业务发展,指导运营决策时,往往会因为指标口径不统一、指标问题难追溯等质量问题,影响企业使用数据,用好数据。

指标平台Kyligence Zen就扮演了提供通用数据语言的角色,使企业内庞大而复杂的 数据指标有统一的管理出口,有标准一致的口径 。同时,每个指标要从业务发展出发,设置目标,从而推动企业内的用数文化。

数据治理好之后,使用门槛的问题也一直困扰着行业。韩卿在演讲中举了一个例子,某头部的金融企业,有七万人,但是数字化最终能触达的用户是7000到8000人,比例在10%左右。而更多的企业当中,这个比例在5%-10%。由于数据工具的使用门槛,企业里大量的数据需求方是被排除在数据分析服务之外的。

在这个背景下,Kyligence Zen降低了企业内业务人员用数时对专业开发的依赖。业务和管理层可以利用这个工具,实现用数据来驱动组织运营和管理。过程中,高性能的Kyligence 企业级OLAP平台不断满足客户高并发、高性能、低成本需求,予以指标平台更好的底层能力支持。

当AI技术带来人机交互的能力的革命性突破,Copilot产品让专业化的数据分析工具变得更平民化、更可用,数据在企业内流动和使用更自如,企业内的运营和管理的潜力则进一步释放。

“ Copilot加指标体系加上合理的成本,是一个比较完美的组合 ”,李扬说,这个组合通过快速解决实际的问题,产生业务闭环,可能会是飞轮转动的第一圈,做得好能带来大模型在更多场景的落地。

总体而言,Kyligence正在形成从“AI助手+指标平台+智能引擎”的三驾马车驱动的格局。在“以AI变革组织运营与管理”全新愿景下,以用户的实际数据应用为导向为中心,通过全新的产品家族帮助企业实现人人用数的愿景,释放数智生产力。

03

从先锋企业到大众市场

Gartner的一份报告显示,企业在数据分析领域,越来越关注价值优化和可观察性,重视ROI指标,数据要与业务规则和应用更紧密结合,阐述为组织提供的价值。

实际上,这也是经济增速放缓、市场竞争激烈的背景下,多变的消费需求和高风险的生存环境给大数据领域的玩家们提出的新要求。越来越多企业希望 用数据智能工具,切实指导企业的运营和管理 ,实现数智赋能。

德邦物流CTO殷皓有一阵子始终对企业内两个维度的数据反馈不太满意。一个是客户体验环节,一个是成本评估环节。

以客户体验环节为例,企业管理层很难从各类已有的数据指标里看到客户对服务的即时态度和反馈。比如,投诉这个指标,只有少部分用户在不满意服务时会选择投诉,大量的用户一旦不满意服务,只会悄悄流失,不再使用产品,企业经营者很难知道用户到底是因为什么原因离开自己的平台。

物流行业里另一个 重要的数据指标是成本 。企业如果能够把经营数据精细化到每一单快递上,就能更好判断不同部门运营环节里的资产过剩和执行效率不够的问题,从而降低整体经营成本。

这些与业务密切相关的数据管理动作,意味着企业的数据平台上每天要处理的数据量级非常庞大,殷皓在Kyligence用户大会的演讲中提到,大概有600亿条数据, 每天处理差不多20亿条数据 。同时数据指标要能切实反映业务的进展和变化,并且各个系统及层级要统一口径。

与德邦物流类似,平安银行同样在企业经营管理的“用数”环节感受到了明显的痛点和瓶颈。

除了希望更好地用数据来提升用户体验,降低运营成本,他们在日常企业运营和管理中的另一个突出“用数”痛点还包括, 业务数据获取效率低下问题 。例如做运营的团队想做一场营销活动,需要数据来做支撑。但获得数据往往要靠IT部门来提供技术支持,需要相当长时间才能交付数据和报表。

在与平安银行和德邦物流的沟通中,Kyligence发现了这些痛点,并基于自身的产品,帮助企业打造了更为高效、智能与科学和即时的数据平台,为企业的运营和管理提供了更准确的依据,助力企业的数智化运营与管理。

Kyligence Copilot产品推出后,团队也非常重视先锋市场的反馈,用户大会当天有一场闭门会,他们想来试探市场水温。从当天的反馈看,客户反应颇为热烈。“展台的工作人员跟我说,好多客户跑过来连问三遍这个东西怎么买。从用户的角度来看,他们比我们的焦虑感要多得多”,韩卿判断,这里面有巨大的商业价值。

这些焦虑的企业,也是各行各业的头部玩家,他们对企业经营管理等数智化变革有强烈等意愿和需求。数智前线获悉,其中金融行业里不少大玩家早已经把市面上的大模型产品体验了一遍。

Kyligence正与这些头部客户们探讨方案细节,摸索商业落地的闭环。而经由大市场检验的产品也会以标准化产品推向更主流的市场。Kyligence Copilot 也将在具体落地场景中得到更多使用反馈。

先锋应用阶段意味着更高应用门槛,而进入大众市场,产品会降低门槛。

Kyligence目前的产品家族,已经覆盖了从专业先锋市场到大众的中小企业主流市场。如指标平台Kyligence Zen,除了已发布的SaaS版本,本月也将发布Cloud版本,以及可以部署到私有环境下的Enterprise版,从中小企业市场到专业市场KA用户一网打尽。

另外,Kyligence的产品也在朝着进一步降低使用门槛方向落地。“企业级OLAP平台有较高使用门槛,需要专业的数据分析,用户才能用。而指标平台是普通业务用户就能用的,至于Copilot产品则能够让更广泛的大众来用。”韩卿介绍。

从行业选择看,Kyligence的产品家族也有偏重,将 重点聚焦在金融、制造、零售、医药四个行业 ,以标准化的产品服务客户。并且,也致力于与合作伙伴共同打造行业专属解决方案。

结语:新的壁垒

如何完成商业化始终是新技术应用绕不开的问题。Copilot产品与数据智能的结合当下 仍在探索初期 ,要真正形成标准产品落地,依然面临挑战。

韩卿告诉数智前线,除了国内大模型的性能及可用性问题,应用的企业 需要有一定的数据治理基础 ,才能真正把“AI+DATA”的价值发挥出来。

在外界看来,这依然意味着使用门槛。韩卿则判断,基于“ 边使用、边治理 ”的数据使用逻辑,企业里的一些部门可以先用门槛相对低的产品,体验数据智能带来的变革。

同时,随着AI带来的进步,过去大量的由人工完成的治理工作部分正由AI完成,减少治理专家的投入。过程中,一些场景的共性显现,再去进一步治理,最终形成一个更成熟的应用模型。这也是AI对软件行业能带来的改造。

韩卿非常务实,他认为创业公司要在商业化和创新之间找到平衡,他用了一个形象的比喻,“ 服役一代,研制一代,探索一代 ”,来比拟Kyligence这家公司的产品推进策略。

在AI时代,这家企业基于过往的产品能力,快速将大语言模型和此前的指标平台及企业级OLAP平台结合,用AI工具来更高效、更便捷帮助企业打造自身的数据智能能力,变革组织运营和管理。这种差异竞争路线,使得他们对自身的定位也在发生变化。韩卿认为, Kyligence正在从一家技术公司朝向管理软件企业发展。

在转轨阶段,韩卿认为,企业的竞争壁垒不仅体现在技术积淀和更全面的产品组合,先锋客户本身也成了大模型应用落地竞争里的壁垒。“我们目前已经合作的,最大的一批数字化转型先锋的客户,也是我们积累的壁垒。这点令人骄傲。”

热文榜单