盘古大模型

来自站长百科
跳转至: 导航、​ 搜索

盘古大模型是华为旗下的盘古系列AI大模型,包括NLP大模型、CV大模型、科学计算大模型等。其中,中文语言(NLP)大模型是业界首个超千亿参数的中文预训练大模型,被认为是最接近人类中文理解能力的AI大模型。

技术架构[ ]

盘古大模型采用了“5+N+X”的三层架构,其中“5”代表L0层的五个基础大模型,包括自然语言、视觉、多模态、预测和科学计算大模型,提供满足行业场景中的多种技能需求。这些基础大模型提供了不同参数规模的选择,以匹配客户在不同场景下的多样化需求。此外,盘古大模型3.0还提供了一系列的能力集,如NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力。

在具体模型方面,盘古NLP大模型是业界首个超千亿参数的中文预训练大模型,它在中文语言理解能力上接近人类水平,并在权威的中文语言理解评测基准CLUE榜单中取得了优异成绩。盘古CV大模型则是超过30亿参数的业界最大CV大模型,它能够根据模型大小和运行速度需求自适应抽取不同规模的模型,让AI应用开发快速落地。此外,盘古大模型还包括预测大模型、多模态大模型和科学计算大模型,分别在各自的领域内有着广泛的应用。

特色功能[ ]

盘古NLP大模型[ ]

盘古NLP大模型是业界首个超千亿参数的中文预训练大模型,具有强大的内容生成和理解能力。它采用了Encoder-Decoder架构,使其在不同类型的系统中具有很高的嵌入灵活性。该模型在2019年的CLUE(Chinese Language Understanding Evaluation)基准测试中取得了第一名,显示出其卓越的语言理解能力。

盘古CV大模型[ ]

盘古CV大模型是一个基于海量图像和视频数据构建的视觉基础模型。它可以用于图像分类、分割和检测等任务。该模型是业界最大的CV大模型,能够根据需求提供不同规模的模型,加速AI应用的开发和部署。

盘古多模态大模型[ ]

盘古多模态大模型融合了语言和视觉的跨模态信息,能够实现图像生成、3D生成和视频生成等功能,具有原生支持中文、精准语义理解、更具自然美感、更强泛化性、全栈自主可控、支持二次训练等功能优势,非常适合平面设计、游戏开发、影视制作和电商营销等行业使用。

盘古预测大模型[ ]

盘古预测大模型是面向结构化数据,基于神经网络Transformer架构,通过任务理解、模型推荐、模型融合技术,构建通用的预测能力。通过使用盘古预测大模型,可实现回归预测、分类预测、时间序列预测和异常预测等功能。

盘古科学计算大模型[ ]

科学计算大模型是面向气象、医药、水务、机械、航天航空等领域,融合AI数据建模和AI方程求解的方法;从海量的数据中提取出数理规律,使用神经网络编码微分方程;使用AI模型更快更准的解决科学计算问题。

发展历史[ ]

  • 2020年11月,盘古大模型在华为云内部立项成功,也完成了与合作伙伴、高校的合作搭建。
  • 2021年4月,盘古大模型正式对外发布。
  • 2023年3月,华为云官网显示盘古系列AI大模型中的NLP大模型、CV大模型、科学计算大模型已经标记为即将上线状态。
  • 2023年7月,华为开发者大会上,华为常务董事、华为云CEO张平安宣布,华为云盘古大模型3.0正式发布。
  • 2023年7月,华为联合山东能源集团宣布华为盘古大模型在矿山领域实现首次商用,解决人工智能在矿山领域落地难的问题。
  • 2023年9月,华为发布小艺输入法 Beta 版 1.1.9.209 众测任务,搭载了盘古大模型。

相关条目[ ]