当前位置:AIGC资讯 > 搜索 "ppt"
-
北大推出首个多轮多模态ppt任务完成基准pptC GPT-4完成正确率仅6%
北大和微软亚洲研究院的研究人员提出了一项新的评估基准pptC,旨在评估大型语言模型在复杂多轮多模态ppt任务中的表现。 他们通过创建包含数百个多模态指令的数据集,挑战大模型在多轮人机对话中生成ppt文...
-
GPT-4完成正确率仅6%!北大等提出首个「多轮、多模态」ppt任务完成基准pptC
多模态环境中利用复杂工具完成多轮、多模态指令的评估空白,研究人员引入了PowerPoint任务完成(pptC)基准测试,以评估LLM创建和编辑ppt文档的能力。 最近对大型语言模型(例如ChatGPT...