-
LeCun发文质疑LLM推理能力 大模型涌现离不开上下文学习
LeCun发文质疑LLM推理能力 大模型涌现离不开上下文学习...
-
vivo“蓝心千询”APP正式上线开放下载 集成蓝心大模型
vivo宣布,基于vivo蓝心大模型研发的公版App“蓝心千询”现已正式上线。 此前,vivo发布了蓝心大模型,并推出了基于该模型的公版App“蓝心千询”,供所有安卓和iOS用户免费使用。 这个应用...
-
星火大模型AI接口Spring中项目中使用【星火、AIGC】
星火大模型AI接口使用 讯飞的星火大模型是有免费版本赠送200万个Token,就个人学习来说完全够用了。 免费申请过后,到控制台,两个红色方框是最要紧的。 星火认知大模型Web文档 |...
-
国产大模型黑马诞生,千亿级拿下双榜第一!知识正确性能力突出,大幅降低LLM幻觉问题
【新智元导读】夸克,也下场大模型了。甫一问世,夸克大模型就迅速登顶权威测评双榜第一,幻觉率大幅降低,可以预见,风靡年轻人的夸克APP,要掀起新的飓风了。 最近的各大手机厂商和互联网公司,都在卯足了劲儿...
-
“大模型本质就是两个文件!”特斯拉前AI总监爆火LLM科普,时长1小时,面向普通大众
做了一个关于大语言模型的科普视频。 时长1小时,全部为“非技术介绍”,涵盖模型推理、训练、微调和新兴大模型操作系统以及安全挑战,涉及的知识全部截止到本月(非常新)。 △视频封面图是Andrej用Da...
-
【大模型AIGC系列课程 2-3】动手为ChatGPT打造第二大脑
【大模型AIGC系列课程 2-3】动手为ChatGPT打造第二大脑...
-
清华大学提出全新加速训练大模型方法SoT
清华大学提出全新加速训练大模型方法SoT...
-
AIGC重塑教育:AI大模型驱动的教育变革与实践
教育家、企业家鼎力推荐 配套视频讲解,持续更新AIGC领域前沿知识 《AIGC重塑教育:AI大模型驱动的教育变革与实践》,京东官方购买链接为:https://item.jd.com/13815...
-
淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA
9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA,旨在让技术开发者们能够更方便地提升大语言模型训练性能,降低训练成本,并保持和LLaMA社区的兼容性。测试显示...
-
腾讯披露最新大模型训练方法,可节省50%算力成本
在算力紧缺的背景下,如何提升大模型训练和推理的效率,并降低成本,成为业界关注的焦点。 11月23日,腾讯披露,腾讯混元大模型背后的自研机器学习框架Angel再次升级,大模型训练效率提升至主流开源框架...