logo老杨的博客
首页 留言 登录
关于AI的思考(二)

基于最近接触的企业咨询、外出培训和学生竞赛等事宜,谈谈个人对AI相关应用落地的看法。

目前能在消费端落地的方向大至有三个:

一、智能体(AI Agent)

集成RAG、MCP与WorkFlow的垂类智能体,是当前AI落地场景中最具潜力的方向之一。随着LLM的普及,以及Agent搭建门槛的持续降低,越来越多开发者与企业能够快速上手构建专属AI应用。这种规模化的尝试与探索形成量变积累,更让该赛道具备了诞生现象级产品的土壤。但受制于大语言模型自身的局限性,此类智能体目前更适用于处理 “特定单业务” 场景,核心价值在于作为已有复杂业务系统的辅助工具 —— 优化效率、降低成本而存在。想要完全取代甚至颠覆现有成熟的复杂业务系统,短期内难以实现。

二、计算机视觉识别(Computer Vision)

当前互联网上融合视觉模型与LLM的多模态产品已呈现多样化落地态势。消费端典型应用包括文生图、图生视频、虚拟穿搭试衣、商品外观智能设计、商品布景实时更换等,覆盖创意设计、电商营销等多个场景。此类产品的技术门槛显著高于单一模态应用,传统开发者需跨越AI技术鸿沟,补齐视觉模型训练、跨模态数据融合、LLM视觉理解适配等核心能力,同时积累实际项目经验,才能基于开源模型完成产品化落地。但最大的挑战在于市场供需匹配问题,需警惕 “技术导向” 思维,即 “端着产品找需求”。缺乏对用户真实痛点的挖掘,容易导致供需错位,最终出现产品功能看似先进,但因无法精准解决用户问题而面临无人买单的市场窘境。

三、具身智能(Embodied AI)

具身智能的价值,目前更多还是停留在资本市场的热度层面,尚未在消费端形成实质性落地。无论是国外的Figure、擎天柱,还是国内的宇树、云深,该赛道属于重资产投入领域,需要持续的Money和IQ支撑,仅巨头企业具备撬动行业的资源与实力,普通开发者及未获得融资的小企业难以参与竞争。此外,具身智能作为高度复杂的跨学科领域,技术门槛远超上面两个方向。模型与算法仅为其中一小部分,更大的挑战集中在机械结构设计、高精度自动控制、特种材料研发等传统工程学科的融合协同。从商业落地来看,具身智能需完成从边缘计算、逻辑决策到动作执行的全链路能力突破,整体性能达到人类70%的综合水平,才具备大规模普及的基础。目前行业仍处于技术积累阶段,让子弹再飞一会吧。

下一篇:关于AI的思考(一)
验证码
评论留言 (0条)