上下文学习第2页

AI视野：Copilot将可免费使用GPT-4Turbo；Bing推深度搜索功能；谷歌推桌面版Chrome“帮我写”；百度腾讯等入股无问芯穹

???AI新鲜事微软Copilot将可免费使用GPT-4Turbo 微软宣布Copilot将集成OpenAI最新工具，特别是强化版的GPT-4Turbo。GPT-4Turbo具有更大的上下文窗口和更新的知识截止日期，提供更深入的见解。微软表示，整合后将使...

AIGC 2023-12-06 人工智能

967阅读

大模型免微调解锁对话能力，RLHF没必要了！一作上交大校友：节省大量成本和时间

要搞大模型AI助手，像ChatGPT一样对齐微调已经是行业标准做法，通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发现，这两步都不是必要的？？？新论文指出，预训练完成刚出炉的基础模型已经掌握了遵循指令的能力，只需要提示工程就能引导出来，引起...

AIGC 2023-12-06 人工智能

848阅读

颠覆Transformer霸权！CMU普林斯顿推Mamba新架构，解决致命bug推理速度暴增5倍

深度学习进入新纪元，Transformer的霸主地位，要被掀翻了？ 2017年6月12日横空出世，让NLP直接变天，制霸自然语言领域多年的Transformer，终于要被新的架构打破垄断了。 Transformer虽强大，却有一个致命的bug：核心注意力...

AIGC 2023-12-05 人工智能

1207阅读

Transformer挑战者出现！斯坦福CMU联合团队，开源模型及代码，公司已创办

现在ChatGPT等大模型一大痛点：处理长文本算力消耗巨大，背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构，成为有力挑战者，引起大量关注： Mamba（曼巴，一种蛇），在语...

生成式AI 2023-12-05 人工智能

843阅读

AIGC系列：1.chatgpt可以用来做哪些事情？

上图的意思：神器轩辕剑那么，在现在AI盛行的信息时代，你是否知道如何获得和利用ChatGPT这一把轩辕剑来提升你的攻击力和生存能力呢？故事程序员小张：刚毕业，参加工作1年左右，日常工作是CRUD 架构师老李：多个大型项目经验...

大数据 2023-12-03 人工智能

841阅读

【云上探索实验室】快速入门AI 编程助手 Amazon CodeWhisperer ——码上学堂领学员招募

目录一、Amazon CodeWhisperer 1.1、大语言模型与AI编程 1.2、CodeWhisperer初体验二、云上探索实验室-码上学堂 2.1、码上学堂 2.2、学课通道入口三、领学员招募 3.1、报名方式 3...

生成式AI 2023-11-30 人工智能

902阅读

LeCun发文质疑LLM推理能力大模型涌现离不开上下文学习

近期，LeCun在推特上引发了关于大语言模型（LLM）推理能力的讨论，强调LLM缺乏真正的规划推理能力，其涌现能力实际上是上下文学习的结果。研究通过多个实验验证LLM在复杂规划任务上表现不佳，强调其能力受限于任务复杂度。研究团队在GPT-4上进行的实验显...

大数据 2023-11-24 人工智能

881阅读

南开大学与字节跳动研究人员推出开源AI工具ChatAnything：用文本描述生成虚拟角色

南开大学与字节跳动研究人员合作推出了一项引人注目的研究，发布了一种名为ChatAnything的全新AI框架。该框架专注于通过在线方式生成基于大型语言模型（LLM）的角色的拟人化形象，从而创造具有定制视觉外观、个性和语调的人物。简答的说，ChatAnyt...

AIGC 2023-11-22 人工智能

1132阅读

copilot技巧

copilot技巧 csdn排版不太好，推荐notion查看：https://superb-face-6ae.notion.site/copilot-25cf0f9882364056b5c76909b3a66ef9 一些基础原理：我们想要使用cop...

大数据 2023-11-22 人工智能

758阅读

【文心一言 vs. 通义千文】一言对千问：自百度之后，阿里终于还是出手了——通义千问

通义千问： https://tongyi.aliyun.com/通义千问https://tongyi.aliyun.com/ 目录通义千问：达摩院 GPT-30B 模型复现 GPT-3 模型介绍 GPT3中文30B参数量文本生...

人工智能 2023-11-22 人工智能

1123阅读

谷歌DeepMind力证：GPT-4终局是人类智慧总和！Transformer模型无法超越训练数据进行泛化

Transformer模型是否能够超越预训练数据范围，泛化出新的认知和能力，一直是学界争议已久的问题。最近谷歌DeepMind的3位研究研究人员认为，要求模型在超出预训练数据范围之外泛化出解决新问题的能力，几乎是不可能的。 LLM的终局就是人类智慧总和...

AIGC 2023-11-06 人工智能

790阅读

图模型也要大？清华朱文武团队有这样一些观点

在大模型时代，图机器学习面临什么样的机遇和挑战？是否存在，并该如何发展图的大模型？针对这一问题，清华大学朱文武教授团队首次提出图大模型（Large Graph Model）概念，系统总结并梳理了图大模型相关的概念、挑战和应用；进一步围绕动态性和可解释性，...

AIGC 2023-10-31 人工智能

979阅读

Agent 应用于提示工程

如果Agent模仿了人类在现实世界中的操作方式，那么，能否应用于提示工程即Prompt Engingeering 呢？从LLM到Prompt Engineering 大型语言模型(LLM 是一种基于Transformer的模型，已经在一个巨大的语料库或...

人工智能 2023-10-30 人工智能

1110阅读

小模型如何比肩大模型，北理工发布明德大模型MindLLM，小模型潜力巨大

大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能，但是由于训练和推理大参数量模型需要大量的计算资源，导致高昂的成本，将大语言模型应用在专业领域中仍存在诸多现实问题。因此，北理团队先从轻量级别模型入手，最大程度发挥数据和模型的优势，立足更...

AIGC 2023-10-28 人工智能

1068阅读

GPT-4教会机器手转笔、玩魔方！RL社区震惊：LLM设计奖励竟能超越人类？

GPT-4，竟然教会机器人转笔了！图片英伟达、宾大、加州理工、德州奥斯汀等机构的专家提出一个开放式Agent——Eureka，它是一个开放式Agent，为超人类水平的机器人灵巧性设计了奖励功能。图片论文链接：https://arxiv.org/p...

AIGC 2023-10-24 人工智能

1020阅读

机器人学会转笔、盘核桃了！GPT-4加持，任务越复杂，表现越优秀

大数据文摘出品家人们，继人工智能（AI）攻占象棋、围棋、Dota之后，转笔这一技能也被 AI 机器人学会了。上面这个笔转的贼溜的机器人，得益于名叫Eureka的智能体（Agent），是来自英伟达、宾夕法尼亚大学、加州理工学院和得克萨斯大学奥斯汀分...

人工智能 2023-10-23 人工智能

896阅读

有了GPT-4之后，机器人把转笔、盘核桃都学会了

在学习方面，GPT-4 是一个厉害的学生。在消化了大量人类数据后，它掌握了各门知识，甚至在聊天中能给数学家陶哲轩带来启发。与此同时，它也成为了一名优秀的老师，而且不光是教书本知识，还能教机器人转笔。这个机器人名叫 Eureka，是来自英伟达、宾夕法...

人工智能 2023-10-23 人工智能

963阅读