-
小红书搜索团队提出全新框架:验证负样本对大模型蒸馏的价值
些带有错误答案的合成数据。 在 AAAI 2024 上,小红书搜索算法团队提出了一个创新框架,在蒸馏大模型推理能力的过程中充分利用负样本知识。负样本,即那些在推理过程中未能得出正确答案的数 大语言...
-
AIGC:【LLM(七)】——Baichuan2:真开源可商用的中文大模型
AIGC:【LLM(七)】——Baichuan2:真开源可商用的中文大模型...
-
【AIGC工具】我找到了使用大模型问答的最短路径!
Claude、Copilot、豆包、讯飞星火等,打开平时常用的即可。 第三步:快速提问LLM大模型 好了,现在所有前置步骤都完成了,我们来看看提问大模型的效果: 唤醒输入框后,输入文字,U...
-
Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%
近日,国产开源项目SwiftInfer实现了无限流式输入推理,成功提升了大模型推理性能46%。这是一个重大突破,可以为多轮对话场景提供高效可靠的落地方案。 它采用了attention sink注意力机...
-
四行代码让大模型上下文暴增3倍,羊驼Mistral都适用
无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍! 而且是“即插即用”,理论上可以适配任意大模型,目前已在Mistral和Llama2上试验成功。 有了这项技术,大模型(LargeLM)...
-
大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制
I团队开源了SwiftInfer,基于TensorRT实现了StreamingLLM,可以进一步提升大模型推理性能46%,为多轮对话推理提供了高效可靠的落地方案。 开源地址:https://githu...
-
微软祭出代码大模型WaveCoder!四项代码任务两万个实例数据集,让LLM泛化能力飙升
用高质量数据集进行指令调优,能让大模型性能快速提升。 对此,微软研究团队训练了一个CodeOcean数据集,包含了2万个指令实例的数据集,以及4个通用代码相关任务。 与此同时,研究人员微调了一个代码...
-
OPPO Find X7搭载安第斯大模型:首发AI大模型通话摘要
300旗舰芯片,新机在AI方面也有巨大提升。 据介绍,OPPO Find X7搭载70亿参数的安第斯大模型,在AI加持下,小布助手全新升级,拥有AI画师、小布照相馆、小布连麦等100功能。 官方表示,...
-
文心一言没有体验上,看看讯飞星火认知大模型
目录 前言 正文 1.简单对话环节 1.1什么是讯飞星火认知大模型 1.2你都可以干一些什么 1.3你的训练数据库还在持续更新么 1.4今天是哪一天 1.5宇宙中有哪些目前认为可能...
-
除了AIGC和大模型,2023年这个赛道也很拥挤
能市场上的变化,帮助企业管理者、创业者、求职者发现和理解正在变化的市场和其中的机遇。 AIGC、大模型和文娱是“拥挤赛道” 今年前9个月,人工智能领域中共有88例投融资事件,如果按照主营业务的...