元象发布了 XVERSE-MoE-A4.2B 大模型,采用混合专家模型架构,激活参数为4.2B,效果媲美13B 模型。该模型全开源,免费商用,可用于海量中小企业、研究者和开发者,推动低成本部署。
该模型具有极致压缩和超凡性能两大优势,采用稀疏激活技术,效果超越多个业界顶流模型,并接近超大模型。元象 MoE 技术自研创新,研发高效融合算子、细粒度专家设计、负载均衡损失项等,最终采用实验4对应的架构设置。
在商业应用上,元象大模型已与多个腾讯产品进行深度合作,为文化、娱乐、旅游、金融领域提供创新用户体验。
Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A4.2B
ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A4.2B
Github:https://github.com/xverse-ai/XVERSE-MoE-A4.2B