摘要: 李开复领导的AI公司零一万物推出了首款Yi系列开源大模型,其中Yi-34B在中文语言理解方面表现出色,超越了GPT-4,估值已超过10亿美元。这一突破性模型能够处理超长文本输入,甚至能够理解超过1000页的PDF文档,为中文自然语言处理领域带来了新的希望。
李开复创立的零一万物公司宣布推出首款Yi系列开源大模型,标志着该公司在人工智能领域的巨大进展。这一新系列包括了Yi-34B和Yi-6B两个模型,其中Yi-34B在多项中文语言理解测试中表现出色,令人瞩目。
Yi-34B在Hugging Face的英文测试榜单中位列第一,同时在C-Eval中文能力排行榜上超越了所有开源模型。这一模型具有令人印象深刻的200K上下文窗口,能够处理40万汉字超长文本输入,甚至能够理解超过1000页的PDF文档。这一功能对于处理大规模文本和数据的任务具有巨大的潜力,尤其是在学术研究和企业应用领域。
在C-Eval中文能力排行榜上,Yi-34B超越了所有其他开源模型,表明它在中文语言理解和生成方面的性能优于竞争对手。此外,在中文综合能力方面,Yi-34B在CMMLU、E-Eval、高考等中文评测指标上明显领先于GPT-4,展现了其在中文语境下的强大理解和应用能力。
而在中文问答能力方面,Yi-6B和Yi-34B与GPT-4的表现水平相当,在BoolQ和OBQA两个中文问答指标上,它们都能够理解中文问题并提供准确的答案,展示了其高水平的能力。
零一万物公司的这一突破性推出引起了广泛关注,特别是在中文自然语言处理领域。该公司估值已超过10亿美元,展示了其在AI创新方面的领先地位。这一开源大模型Yi系列的发布将为中文语境下的各种应用带来更多可能性,包括智能搜索、知识管理和自然语言生成等领域。这一进展将进一步推动人工智能技术的发展,为未来带来更多的机会和挑战。