文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品,被外界誉为“中国版ChatGPT”,将于2023年3月份面向公众开放。
大模型成功必备的五要素,分别是数据、算力、平台、模型和生态,而百度作为国产ChatGPT的领头羊,五大要素皆已配备。
海量数据: 即训练大参数模型的“燃料”,根据IDC数据,其拥有5500亿条知识,且已经应用于百度搜索、信息流、智能驾驶、百度 图、小度等产品。
模型储备: 百度实现了全生态的布局,其中包括NLP、CV、跨境大模型、生物计算等领域。
NLP领域: ERNIE系列,是基于知识增强的千亿模型,用于智能创作、摘要生成、问答、语义检索、情感分析、信息抽取等能力。PLATO 模型,是全球首个超百亿参数规模的中英文对话训练模型,可以让机器人像人一样具有逻辑且自由对话的功能。
CV领域: VIMER-CAE,应用于图像分类、目标检测、语义分割等场景;VIMER-UFO,拥有170亿参数,覆盖人脸、人体、车辆、商品、食 物细粒度分类等 20+的视觉多任务模型;OCR -VIMER-StrucTexT广泛应用于文档、卡证、票据等图像文字识别和结构化理解;VIMERUMS业内首发多源图文模态表征的商品多模态预训练模型;
跨境大模型:可实现AI作画、场景融合视觉常识推理、跨模态图像检索、跨模态文本检索等多场景。
生物计算: 应用场景为蛋白结构预测和小分子药物研发等领域。
平台方面: 拥有自主生态的百度百舸 · AI异构计算平台,具备高效率、多密度、高易用性、多场景部署、乐高式拼接等能力。
算力底座: 百度自身具有建设智能算力中心的实力,技术领先且自主可控,已有典型落地案例;服务器方面拥有自妍的昆仑芯云服务器, 具有AI计算能力领先、生态兼容、兼具硬件虚拟化、易开发等能力;芯片方面,昆仑芯AI芯片是百度自主研发的芯片,2代芯片已量产, 具备算力支撑强、高速互联等多重优势。
生态: 百度大模型赋能千行百业,已有落地应用,合作厂商分别覆盖科技、金融、航天、影视、汽车、电子制造等诸多产业。