-
北京大学发布EAGLE 大模型推理效率无损提升3倍
近年来,大语言模型在各领域应用广泛,但其文本生成过程昂贵且缓慢。为解决这一问题,滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布了EAGLE。EAGLE的目标是提升大语言模型的推理速度,同时确保输出文本的分布一致性。通过外推大语言模型的第二顶层特征向量...
-
24 LLM错误代码补全:机器学习顶会NeurIPS‘23 智能体评估:自行构建数据集Buggy-HumanEval、Buggy-FixEval+错误代码补全+修复模型【网安AIGC专题11.22】
Large Language Models of Code Fail at Completing Code with Potential Bugs 写在最前面 论文名片 对于命名实体识别、关系抽取任务的启发 课堂讨论 实验 自己构建的数据集...
-
首个「创造式任务」基准来了!北大清华联手发布Creative Agents:专为想象力而生!
近年来,许多研究通过训练服从自然语言指令的智能体,让智能体具有了解决各种开放式任务的能力。 例如,SayCan[1]利用语言模型实现了根据语言描述解决各种室内机器人任务的智能体,Steve-1[2]训练端到端的策略实现了能够在《我的世界》(Minecra...
-
大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE
大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。 近日,滑铁...
-
一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”
斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作! 仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景: 只需输入一段古诗词,诗中场景立刻映入眼帘: 而且还是来回式的,可以再倒回去的那种: 同一起点可以进入不同场景: 真实场景也可以,其中的...
-
OpenAI首席科学家入选《自然》年度十大人物 ChatGPT也有上榜
12月14日消息,据外媒报道,在近一年大热的人工智能领域,OpenAI无疑是最受关注的企业,他们训练的人工智能聊天机器人ChatGPT及开发的大语言模型,是业界重点关注的,OpenAI的高管也是这一领域备受关注的。 从外媒最新的报道来看,在人工智能领域取得...
-
使用LLama和ChatGPT为多聊天后端构建微服务
微服务架构便于创建边界明确定义的灵活独立服务。这种可扩展的方法使开发人员能够在不影响整个应用程序的情况下单独维护和完善服务。然而,若要充分发挥微服务架构的潜力、特别是针对基于人工智能的聊天应用程序,需要与最新的大语言模型(LLM,比如Meta LLama ...
-
AI创新之美:AIGC探讨2024年春晚吉祥物龙辰辰的AI绘画之独特观点
? 鸽芷咕:个人主页 ? 个人专栏:《粉丝福利》 《linux深造日志》 ⛺️生活的理想,就是为了理想的生活! 文章目录 引言 一、龙辰辰事件概述 二、为什么龙辰辰会被质疑AI创作? 1....
-
解锁编程潜能:探索亚马逊CodeWhisperer,打造编程世界的声音引导者
文章目录 前言 一、什么是 Amazon CodeWhisperer? 二、如何使用CodeWhisperer? 安装CodeWhisperer插件 配置CodeWhisperer 生成注释和文档 总结 前言 随着CHATG...
-
聊聊最近chatGPT对程序员的焦虑攻击
最近各种自媒体都在叛卖gpt职业焦虑,连程序圈子也不能幸免。 甚至有正准备入行的同学私信我到底计算机还能不能学,研究生还能不能读。 我985硕毕业,呆过大厂和小厂,现工作5年的程序员, 抛开那些胡吹海谈的软文,想和大家深入聊聊chatgpt和...
-
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力
CLIP是目前最流行的视觉基座模型,其应用场景包括但不限于: 与LLM大语言模型结合成为视觉多模态大模型; 作为图像生成(Stable Diffusion 、点云生成(Point-E 的condition model,实现image-to-3D; 用于...
-
面向 Stable Diffusion 的自动 Prompt 工程算法 BeautifulPrompt
近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型,可以从简单的图片描述中生成高质量的提示词,从而使文生图模型能够生成更美观的图像。BeautifulP...
-
首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为
让GPT-4操纵人形机器人,事先不做任何编程or训练,能搞成啥样儿? 答案是:太 猎 奇 了! 这不,要求机器人表演“在昏暗电影院里狂炫爆米花,却突然发现吃的是隔壁陌生人的?”。 在GPT-4的操纵下,机器人笑容凝固,“尴尬”得摇头扶额后仰: 但在尴尬...
-
LLaMA及其子孙模型概述
文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽 骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性,对...
-
llama.cpp部署通义千问Qwen-14B
llama.cpp是当前最火热的大模型开源推理框架之一,支持了非常多的LLM的量化推理,生态比较完善,是个人学习和使用的首选。最近阿里开源了通义千问大语言模型,在众多榜单上刷榜了,是当前最炙手可热的开源中文大语言模型。今天在github上看到前几天llam...
-
LLM-LLaMA中文衍生模型:Chinese-LLaMA-Alpaca【扩充词表、Lora部分参数预训练、微调】
GitHub:GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 中文LLaMA模型...
-
确保贵企业的数据为生成式AI做好准备的七个方法
译者 | 布加迪 审校 | 重楼 大家都想利用生成式AI和大语言模型的力量,但这里有一个难题。让AI满足很高的期望需要高质量的实用数据,这正是许多组织的不足之处。 麦肯锡最近一份由Joe Caserta和Kayvaun Rowshankish共同撰写的...
-
当ChatGPT遇见stable-diffusion,你不敢相信的创意艺术之旅!
前言 欢迎来到一场创意的旅程,这里将聚焦于 ChatGPT 和 stable-diffusion 这两个令人激动的技术。在这篇文章中,我们将会探索这两种技术如何结合使用,为艺术创作带来全新的可能性。我们将探讨如何利用 ChatGPT 生成富有想象力的创...
-
Stable-Diffusion深度学习文本到图像生成模型
1. Stable Diffusion 1.1 用法和争议 1.2 许可证 1.3 不可控性 1.4 一点想法 1.5 用途 1.6 教程链接 2. Setup 2.1 Draw Things 2.2 diffusionbee 2.3 AUTOMATI...
-
【云上探索实验室】编程范式变革进行时——CodeWhisperer实践全流程及测评分析报告
目录 一、基于LLM的辅助编程——编程范式变革进行时 二、CodeWhisperer + VS Code 安装与配置 2.1、扩展安装 2.2、配置 三、CodeWhisperer实践全流程 3.1、CodeWhisperer基础实验...
-
xAI旗下聊天机器人Grok被指窃取OpenAI代码库并复制ChatGPT回应
12月12日消息,据外媒报道,近日,马斯克旗下人工智能初创公司xAI发布的首款生成式人工智能聊天机器人Grok在拒绝一名用户的请求时,引用了ChatGPT背后的开发商OpenAI的用例政策。对此,Grok被指窃取了OpenAI的代码库,并复制了ChatGP...
-
LLaMA(大规模机器学习和分析)
LLaMA(大规模机器学习和分析 是一个先进的软件平台,是Meta 推出 AI 语言模型 LLaMA,一个有着 上百亿数量级参数的大语言模型用于大规模部署和管理机器学习模型。借助LLaMA,组织可以高效地在大型数据集上训练和部署模型,缩短投放市场的...
-
ChatGPT的训练数据可以通过“偏离攻击”进行泄露
ChatGPT等大语言模型(LLM)使用来自图书、网站及其他来源的海量文本数据进行训练,通常情况下,训练它们所用的数据是一个秘密。然而,最近的一项研究揭示:它们有时可以记住并反刍训练它们所用的特定数据片段。这个现象名为“记忆”。 随后,来自谷歌Deep...
-
智谱AI发布中文 LLM 对齐评测基准AlignBench
智谱AI发布了专为中文大语言模型(LLM)而生的对齐评测基准AlignBench,这是目前第一个针对中文大模型的评测基准,能够在多维度上细致评测模型和人类意图的对齐水平。 AlignBench 的数据集来自于真实的使用场景,经过初步构造、敏感性筛查、参考答...
-
AI视野:Pika1.0首批用户资格揭晓;Runway官宣下场通用世界模型;妙鸭相机推出AI修图;抖音正式上线AI创作功能
???AI新鲜事 Pika1.0首批用户资格揭晓 Pika Labs最新视频生成产品Pika1.0引起轰动,已开始向候补名单用户发放使用资格。Pika1.0以文生成视频为特色,提供3秒视频快速生成、背景修改等功能。用户可在推特或邮箱确认是否成为首批体验者。...
-
阿里研究部门推出了专为东南亚量身定制的AI大模型SeaLLM
阿里巴巴集团旗下研究机构达摩院推出了专为东南亚语言量身定制的人工智能(AI)大语言模型(LLM ,凸显了该公司在更广泛地区发展市场的雄心。 阿里巴巴研究部门表示,东南亚LLM(SeaLLM)在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅...
-
当GPT-4V充当机器人大脑,可能你都没AI会规划
GPT-4V 已经能帮我们设计网站代码,控制浏览器,这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢? 最近,来自清华大学交叉信息研究院的研究者提出「ViLa」算法,实现了让 GPT-4...
-
用户抱怨ChatGPT变懒了,OpenAI回应称没调整模型,正调查原因
12月12日消息,最近有越来越多的用户在抱怨OpenAI最新版的聊天机器人ChatGPT变得“懒散”了。OpenAI回应称正在对相关投诉进行调查。 最新版的聊天机器人ChatGPT是基于OpenAI的GPT-4大语言模型。很多用户抱怨现在的ChatGP...
-
马斯克的AI机器人说自己不能违反OpenAI使用政策,业界分析:可能是这样
12月12日消息,特斯拉和SpaceX首席执行官埃隆·马斯克(Elon Musk)旗下人工智能创企xAI最近发布了其聊天机器人Grok,但好像出了点问题。 上周五,安全测试员贾克斯·温特伯恩(Jax Winterbourne)在社交媒体平台X上发布了一...
-
为Gemini AI大模型找场景 谷歌Project Ellman项目曝光
谷歌团队提出一个设想,用AI技术处理用户照片及搜索引擎查询信息,全面分析出用户的生活是怎样的,这个项目名叫“Project Ellmann”。 按照最初的设想,Project Ellmann会用LLM(比如Gemini)提取信息,从用户的照片中找到特定...
-
百度文心一言GPT免费入口也来了!!!
文心一言入口地址:文心一言能力全面开放 文心一言是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 文心一言的技术特色: 基于飞桨深度学习平台和文心知识增强大模型,...
-
代表AIGC 巅峰的ChatGPT 有哪些低成本开源方案能够复现?一张消费级显卡能不能跑出个6-7成的效果?
文章大纲 文心一言或者chatGPT 怎么回答这样的问题? 文心一言 chatGPT 低成本复现思路0:有哪些开源低成本的中文大语言模型?出乎意料的多! 低成本复现思路1:公司级别的复现,仅仅支持Linu...
-
零一万物Yi-34B-Chat微调模型上线,登陆多个权威榜单
最近,业内众多大模型基准又迎来了一轮 “实力值” 更新。 继 11 月初零一万物发布 Yi-34B 基座模型后,Yi-34B-Chat 微调模型在 11 月 24 日开源上线 ,短时间登陆了全球多个英文、中文大模型权威榜单,再度获得了全球开发者的关注。...
-
和文心一言聊一聊隐私计算,对比ChatGPT!
开放隐私计算 最近文心一言正式发布,标志着国产对话机器人的问世,大语言模型在国内正式落地。相信我们很多人想到的第一件事不仅仅是文心一言,而是拿它和ChatGPT对比。珠玉在前,文心一言背着巨大压力走到我们面前,给我们带来了许多惊喜,同时也能看到...
-
像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略
随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。 一方面,为了高其在目标任务的性能表现,研究者会收集和构建目标任务数据集并对大语言模型(LLM)进行微调,但这种方式通常会导致除目标任务...
-
【文心一言】什么是文心一言,如何获得内测和使用方法。
文心一言 什么是文心一言 怎么获得内测资格 接下来就给大家展示一下 文学创作 商业文案创作 数理逻辑推算 中文理解 多模态生成 用python写一个九九乘法表 写古诗 前言: ?个人主页:以山河作礼。 ??:本文章是帮...
-
行业排名第一!一图了解理想Mind GPT中文大模型
快科技12月11日消息,在理想汽车智能软件发布会上,理想带来了Mind GPT,这是理想全自研的多模态认知大模型,目前还处于内测版本。 据悉,Mind GPT是行业唯一不需要任何指令词就可以使用的大模型,也是行业唯一真正围绕车载场景打造的大模型...
-
理想汽车:理想Mind GPT中文大模型综合性评测榜第一名!
快科技12月10日消息,在刚刚举行的理想汽车智能软件发布会上,理想汽车官宣,在OTA 5.0中,理想同学最大的变化,就是引入了Mind GPT的能力。 Mind GPT是理想全自研的多模态认知大模型,它可以与汽车进行一个完美的融合,让每位家庭成员都能在车里...
-
基于 AIGC,RocketMQ 学习社区探索开源软件学习新范式
AIGC 持续火爆全球,越来越多的场景开始接入并体现非凡的价值。其中应用广泛的场景之一就是智能知识问答,它改变了人们学习的方式,从阅读式到问答式,让知识的获取更加精准有效。开源软件拥有着广泛的求知群体,AIGC+ 社区的结合是学习型社区未来演进...
-
大模型就是「造梦机」,Karpathy一语惊人!人类才是「幻觉问题」根本原因
幻觉,早已成为LLM老生常谈的问题。 然而,OpenAI科学家Andrej Karpathy今早关于大模型幻觉的解释,观点惊人,掀起非常激烈的讨论。 在Karpathy看来: 另外,Karpathy的另一句话,更是被许多人奉为经典。他认为,与大模型相对的...
-
百度AI模型“文心一言”新鲜体验
今天收到通知可以体验百度的AI模型“文心一言”,等了一个多月迫不及待的去体验了一把,以下是体验的相关记录。 1、简单介绍 通过文心一言官网链接https://yiyan.baidu.com/进入,看到如下界面: 在文心一言的自我介绍中,作为人...
-
大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2
增加LLM上下文长度可以提升大语言模型在一些任务上的表现,这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。 对长上下文场景,在解码阶段,缓存先前token的Key和Value(K...
-
专用于手机、笔记本,Stability.ai开源ChatGPT基因的大模型
12月8日,著名开源生成式AI平台stability.ai在官网开源了,30亿参数的大语言模型StableLM Zephyr3B。 Zephyr3B专用于手机、笔记本等移动设备,主打参数小、性能强、算力消耗低的特点,可自动生成文本、总结摘要等,可与70亿、...
-
更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了
已上微软 Azure,即将要上 AWS、Hugging Face。 一夜之间,大模型格局再次发生巨变。 一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。 今日,Meta 终于发布了大家期待...
-
集体暴雷!自动化攻击可一分钟内越狱主流大语言模型
大语言模型应用面临的两大安全威胁是训练数据泄漏和模型滥用(被应用于网络犯罪、信息操弄、制作危险品等违法活动)。 本周内,这两大安全威胁相继“暴雷”。 本周一,GoUpSec曾报道研究人员成功利用新的数据提取攻击方法从当今主流的大语言模型(包括开源和封闭...
-
让工作流更加智能的五款 AI 工具
生成式AI的热潮始于去年ChatGPT的横空出世,而短短一年间这项技术已经被集成至各类生产力平台当中,大大降低了我们日常工作流程的准入门槛和操作难度。 我知道,很多朋友在听到“工作场景下的AI”时,首先担心的都是自己会不会被新技术取代。别怕,本文讨论的工...
-
首个精通3D任务的具身通才智能体:感知、推理、规划、行动统统拿下
想要迈向通用人工智能,必须要构建一个能够理解人类生活的真实世界,并掌握丰富技能的具身通用智能体。 今年以来,以 GPT-4 (V [1]、LLaVA [2]、PALM-E [3] 等为代表的多模态大语言模型(Multi-modal Large Langu...
-
语言模型:GPT与HuggingFace的应用
本文分享自华为云社区《大语言模型底层原理你都知道吗?大语言模型底层架构之二GPT实现》,作者:码上开花_Lancer 。 受到计算机视觉领域采用ImageNet对模型进行一次预训练,使得模型可以通过海量图像充分学习如何提取特征,然后再根据任务目标进行模型...
-
微软高管透露将推出更多超越OpenAI的大语言模型
微软的高级执行官Eric Boyd在一次采访中透露,公司计划在未来推出更多超越OpenAI的大语言模型(LLMs),以迎合企业客户对多样选择的需求。Boyd强调,微软的生成式AI应用及其所使用的LLMs是安全可靠的,但他指出,那些专注于文本生成等领域的公司...
-
Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源
Stability AI以其stable diffusion文本到图像的生成人工智能模型而闻名,但这已不再是该公司的全部业务。 最新发布的StableLM Zephyr3B是一款30亿参数的大语言模型,专为聊天应用场景进行了优化,包括文本生成、摘要和内容个...