阿里巴巴集团旗下研究机构达摩院推出了专为东南亚语言量身定制的人工智能(AI)大语言模型(LLM),凸显了该公司在更广泛地区发展市场的雄心。
阿里巴巴研究部门表示,东南亚LLM(SeaLLM)在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅甸语数据集上进行了预训练,并且在语言和安全任务方面优于其他开源模型。
这是阿里巴巴第一个针对特定地区的LLM,东南亚被视为重要的增长市场。例如,阿里巴巴旗下东南亚电商平台Lazada的目标是到2030年实现1000亿美元的营业额,在该地区拥有3亿消费者。
SeaLLM chat 是 LLM 附带的一款经过微调的聊天助手,旨在帮助使用 LLM 的企业参与东南亚市场。
据了解,阿里巴巴的LLM “通义千问”于今年4月发布,截至本周二,在开源人工智能平台 "Hugging Face "跟踪的所有模型中排名全球第四。
SeaLLM 在非拉丁语系任务中的表现优于 ChatGPT 等其他 LLM,其解释和处理非拉丁语系文本的能力可延长9倍。SeaLLM 在英语和低资源语言(用于训练人工智能对话系统的数据有限)之间的翻译也取得了更好的效果,如老挝语和高棉语。