,你会在8000多个应用场景中找到答案。它们有的在街头巷尾用于提升城市治理水平,有的在工厂产线上用于智能制造管理,也有的用于森林草原防火、珍稀动物监测、水文水质记录、文物古迹预防性保护……
“加快发展新质生产力”已经写入今年的政府工作报告,被列为 2024 年十大工作任务之一。政府工作报告提出,要充分发挥创新主导作用,以科技创新推动产业创新,加快推进新型工业化,提高全要素生产率,不断塑造发展新动能新优势,促进社会生产力实现新的跃升。
在此背景下,南方都市报启动以“向新而行·探寻新质生产力”为主题的系列调研。本期调研走进安防龙头股之一的,这家创立30余年,集研发、制造、应用于一身的老牌制造企业将如何把握人工智能、大模型等技术变革的机遇,进而重塑自身的生产力?
“大华1993年起步,自主研发第一台调度通信机;2001年,成立;2002年,开发第一台8路音视频同步嵌入式DVR;2004年,营业收入超1亿;2008年,大华股份上市;2010年,营业收入超15亿;2015年,营业收入突破100亿.....”这是2023年8月,大华股份董事长兼总裁傅利泉写下的创业30周年回顾。
从自研通讯机起家到成为安防头部企业,大华用了30年时间,如今再一次站在转型的“十字路口”。
最新发布的2023年财报显示,大华股份2023年全年营收为322.18亿元,同比增长5.41%;归母净利润为73.62亿元,同比增长216.73%;扣非净利润29.62亿元,同比增长87.39%。
营收中来自智慧物联产品及方案的收入占比82.7%,同比增长5.79%;创新业务占比15.23%,同比增长19.2%。创新业务主要包括机器视觉及移动机器人、智慧生活、热成像、汽车电子、智慧安检、智慧消防和存储介质等相应业务。
可以看出,智慧物联已成为大华股份的主航道,“以视频为核心的智慧物联解决方案提供商和运营服务商”是其战略定位。
在走访过程中,大华股份相关负责人向南都记者阐述了公司今年在研发和应用层面的规划。
其中在研发方面,大华股份将持续发力视频加非视频技术,成为一个综合的智慧物联解决方案提供方。资料显示,大华股份持续加大对“全感知、全连接、全计算、全智能、全生态”的“五全”能力基座投入与建设,建立起以视频为核心的物联基础设施研发与解决方案闭环服务。其中“全感知”包含视频感知产品、全域 6D 感知技术、多频域感知技术,以及音频感知、智能交互等产品。
在应用层面,大华股份将推动智慧物联产品应用于各行各业。财报显示,2023年大华股份国内业务中,城市业务营收为43.33亿元,同比增长0.18%;企业业务营收为90.87亿元,同比增长9.92%。
在城市业务方面,当下城市发展逐渐转向以民生保障、民生便捷、民生服务为重心,城市治理的重点也随之走向提升服务。与此同时,安全体系的搭建是城市业务的重中之重,需要从应急、抗险、救援等多维度出发,努力实现一体化的安全体系。
行业应用方面,城市治理、交通、能源以及制造企业的数字化转型将会是大华股份重点落地的场景。“面向企业数字化转型,我们希望以视频加非视频的物联技术,再结合应用,解决一些传统人力密集型行业和传统产业竞争力不足面临的难题。”大华股份相关负责人介绍,“面向中小型企业,我们希望通过简单便捷的产品和服务的下沉,满足碎片化的中小企业市场对数字化发展的基本需求。”
如在智慧用电领域,大华股份推出小体积、一体式、AI 负荷识别系列智能空开,可以提升电力系统运行效率和安全性。结合智能照明系统、物联智能抄表系统、智能空调综控系统,该设备可实现园区能源数据实时检测、用能策略自动调配,进而实现能源的精细化管理,帮助大楼节能降耗,践行“双碳”战略。
深耕安防行业30多年,大华股份积累了丰富的视觉AI技术,并拥有超8000个细分场景,这也为其大模型相关算法和工程技术打下了基础。
2023年10月,大华股份面向以视觉为核心的智慧物联领域,发布了多模态融合的行业视觉大模型——大华星汉大模型,通过融合图像、点云、文本、语音等多模态数据,用以提升视觉解析能力。可以看出大华股份商业定位是以视频为核心,视觉无论是对机器,还是对人,它的感知是最综合的。未来大模型最大的落地场景也将在视觉领域。
“多模态”也是国内外大模型企业纷纷“押注”的方向之一。国外厂商中,OpenAI发布了GPT-4V,通过与GPT-4的配合使用,能够将图像作为输入并回答有关问题,让大模型拥有了图像语义理解能力。谷歌紧随其后,发布了业界第一个原生多模态大模型Gemini。今年年初,OpenAI旗下Sora的横空出世,让多模态大模型的潜力与价值更为清晰地被看到。谷歌紧随其后,发布了业界第一个原生多模态大模型Gemini,据悉,Gemini可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。
与文生视频模型Sora相比,大华星汉大模型作为解析式的视频大模型,与Sora的路径恰好相反。“大华主要是帮助客户对其既有的素材和内容做解析,然后客户可根据这个素材里解析的信息、发生的事情来做行为判断。”大华方面介绍称。
据悉,大华股份选择做面向行业的多模态大模型,原因在于行业大模型更贴近产业的落地应用,是为解决实际问题而生,包括如何能让人工智能算法训练效率更高、应用更普遍 ,以及如何让原来的算法更好用、更智能,然后再推动产业的数字化和智能化进程等。
南都记者留意到,国内大厂也在加码多模态大模型。今年年初,阿里升级了通义千问视觉语言大模型,发布了视觉语言模型Qwen-VL-Plus和Qwen-VL-Max,据介绍,Qwen-VL-Max能够准确描述和识别图片信息,并基于图片进行信息推理和扩展创作,能够对画面指定区域进行问答。
相比之下,星汉大模型的核心差异在于从客户角度出发去看问题,其生成的内容是为了帮助客户分析具体问题、提供有价值的数据,这是脱离行业应用场景的深度学习算法无法实现的。
不同的大模型在技术路径之间或有差异,但最终都要走向商业化落地,如何给不同行业和场景带来价值才是大模型发展的“重头戏”。业内普遍认为,去年是“通用大模型元年”,今年则是“行业大模型落地元年”。南都记者留意到,在“百模大战”的“硝烟”下,国内已有不少企业陆续将大模型面向行业落地应用。
2023年6月,腾讯首次公布腾讯云行业大模型研发进展。7月,华为云发布了行业大模型——盘古大模型 3.0,围绕行业重塑、技术扎根、开放同飞三大创新方向。随后的10月,阿里云也基于通义“打样”了8个行业大模型,覆盖制造、公共服务、汽车、健康、金融、零售、科研等场景。
面对市场中的各路选手,大华股份认为,“智慧物联赛道是一个万亿赛道,市场足够宽,同时每个企业有自身不同的优势,相信能容下多家大型企业。”
据大华股份2023年财报介绍,当前业内发布的大模型以生成式大模型为主,常规实现方式是基于一个通用的大模型来扩展不同行业大模型实现处理不同的下游任务。星汉大模型则主要面向视觉解析任务,同时通过打造几个典型的行业视觉大模型来沉淀出一套计算框架,依托这个计算框架,再打造更多的行业视觉大模型。
谈及星汉大模型的行业落地规划,据悉,电力和社会治理是今年内会落地的场景,主要面向G端和B端客户,在实现技术的普惠化后会继续推广到更多场景。
对于大模型落地的难点,行业内普遍认为算力成本是主要制约因素,大幅降低视觉解析大模型应用成本也是其规模化落地的前提。对此,大华股份主要采用大模型小型化技术以及大小模型协同技术,来构建用得起的场景化大模型。“大小模型协同部署是构建用得起的大模型系统的关键,能够保证大模型系统算力成本可控,加速商业落地。”大华股份方面表示。
长远来看,算力成本下降、大模型技术门槛持续降低是必然趋势,大模型最终会实现先进技术的普惠性,当一项新技术在产业应用成熟之后,成本会被大幅降低,继而又会刺激市场增长。
从财报中亦可以看出,人工智能、大模型技术已成为驱动大华股份二次增长的新动力,接下来的重点工作包括“加强人工智能领域的研发和投入,结合多模态和大模型技术能力,推进面向行业应用的行业视觉大模型研发与产业落地,加速AI产业化升级,进一步拓展城市、企业数智化业务规模。”