摘要: 腾讯混元大模型进行了全新升级,正式开放“文生图”功能。该模型在中文效果上超越了GPT 3.5,代码生成能力提升20%,并通过多项技术创新解决了语义理解、内容合理性和图像质量等难题。已有超过180个内部业务接入混元,涵盖腾讯会议、腾讯文档、企业微信、腾讯广告等多个平台。


腾讯混元大模型迈出了一大步,宣布进行全新升级,并正式对外开放“文生图”功能。这次升级让该模型在中文效果上整体超越了GPT 3.5,同时代码生成能力也大幅提升了20%,将其推向了行业的领先地位。

“文生图”功能的开放标志着腾讯混元大模型在文本和图像生成领域的巨大突破。这项功能的难点在于语义理解、生成内容合理性和图像质量。为了克服这些挑战,腾讯进行了多项技术创新。

首先,他们通过中英文细粒度建模提高了模型对细节的理解能力,从而避免了文化差异可能引起的理解错误。其次,模型增强了对二维空间位置的感知,加入了先验知识约束,使生成的图像结构更加合理,降低了错误率。此外,他们采用了多模型融合的方法,提升了生成图像的细节,使人像生成效果提升了30%,场景生成效果提升了25%。

腾讯内部已有多个开发平台接入了腾讯混元大模型,已有超过180个内部业务成功接入混元。这些业务涵盖了各个领域,包括腾讯会议、腾讯文档、企业微信、腾讯广告、微信搜一搜等。这一举措将为用户提供更强大和智能的体验,同时也推动了腾讯在人工智能领域的不断创新和发展。