-
微软战略大转变:拥抱小模型!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 微软的生成式AI战略似乎出现了180度大转变:相比大模型,小模型才是微软的真爱。 在Ignite 2023上,微软董事长兼首席执行官Nadella在主题演讲中表示:“微软喜欢小模型...
-
谷歌研究:通过对抗性数据生成和多元评估应对GenAI的道德和安全风险
谷歌研究团队在人工智能领域持续推动着对生成式AI(GenAI)安全的研究,以应对其在虚假信息、偏见和安全性方面带来的挑战。作为谷歌研究的一部分,负责构建负责任的AI和数据系统的Responsible AI and Human-Centered Techno...
-
YouTube 推出可模仿著名歌手的 AI 工具,可用文字或哼唱创作歌曲
11 月 16 日消息,YouTube 正在测试新的生成式 AI 功能,让用户可以通过输入文本或哼唱一段旋律来创作音乐。其中一个功能叫做 Dream Track,已经向平台上的一些创作者提供,它可以根据著名艺人的风格自动生成 30 秒的音乐片段。该功能可...
-
Vicuna Makers打造小型AI模型Llama-rephraser,130亿参数、性能媲美GPT-4
Vicuna Makers的研究团队在构建Vicuna语言模型的基础上,成功推出了一款新型的小型人工智能模型(LLM),该模型在性能上与OpenAI的GPT-4相媲美,仅包含130亿个参数。 这一新模型被命名为Llama-rephraser,由LMSYS...
-
【NLP】Llama & Alpaca大模型
?大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流? ?个人主页-Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】 自然语言...
-
以预览版形式,微软确认 Windows 10 系统将引入 Copilot
IT之家 11 月 17 日消息,微软官方近日发布支持文档《我们如何在 Windows 10 中实现价值最大化》,确认 Win10 系统中将引入 Copilot 功能。 IT之家附上微软官方支持文档内容如下: 我们不断评估如何适应最新的技术进步,以最好...
-
微软新专利公布:通过机器学习创建出“会脸红”的逼真头像
11 月 16 日消息,微软的一项新专利于当地时间周二在美国专利商标局网站上公开,这是一种新的机器学习模型专利,可为用户创作出“更加有生命力”的逼真头像。 据介绍,通过新的机器学习模型,头像或照片可针对细节部分进行调整,使照片看起来更加自然。微软将使...
-
C#开源项目:私有化部署LLama推理大模型
推荐一个C#大模型推理开源项目,让你轻松驾驭私有化部署! 01 项目简介 LLama是Meta发布的一个免费开源的大模型,是一个有着上百亿数量级参数的大语言模型,支持CPU和GPU两种方式。 而LLamaSharp就是针对llama.cpp封装的C#...
-
NVIDIA RTX显卡AI推理提速5倍!RTX PC轻松在本地搞定大模型
正在举行的微软Iginte全球技术大会上,微软发布一系列AI相关的全新优化模型、开发工具资源,帮助开发者更深入地释放硬件性能,拓展AI场景。 尤是对于当下在AI领域占据绝对主导地位的NVIDIA来说,微软这次送上了一份大礼包,无论是面向OpenAI Cha...
-
韩国央行警告:AI 或抢走该国 400 万人的“饭碗”
IT之家 11 月 16 日消息,韩国央行近日发布了一项关于人工智能(AI)对劳动力市场影响的研究报告,预测未来 20 年,AI 可能会导致该国多达 400 万个工作岗位消失,占总工作岗位的 14%。这是继高盛、麦肯锡等机构之后,又一次对 AI 威胁的...
-
谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频
11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。 AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。...
-
研究发现,ChatGPT 能理解和回应人类情感
自从 OpenAI 的聊天机器人 ChatGPT 走红以来,人们对人工智能(Artificial Intelligence,简称 AI)的兴趣达到了新的高度。虽然 AI 并不是一个新领域,但它确实是一个相对未被探索的行业,越来越多的公司正在投入资源进行研究...
-
TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现
11 月 16 日消息,业内领先的科研机构、美国国家超级计算中心和诸多 AI 领域龙头公司,近日联合组建了万亿参数联盟(Trillion Parameter Consortium,简称 TPC)。 由 DALL-E 3 生成 IT之家从报道中获悉,TPC...
-
GenAI正在塑造未来的事件管理流程
尽管大多数受访者(59.4% 已经制定了明确的事件管理流程,并且自动化水平能够满足他们的需求(71.1% ,但公司仍在努力应对激增的事件,并且仍在努力快速处理这些事件。 66.5%的公司报告称,在过去12个月中,影响其客户的事件的频率有所增加,比202...
-
AI领域29个必须知道的统计和趋势数据
ChatGPT 在 2022 年 11 月爆炸性推出后风靡全球,而在 2023 年,人工智能 (AI) 革命当然没有任何放缓的迹象。每一天,企业都在寻找使用人工智能来节省时间和金钱的新方法,最新的人工智能统计数据反映了该技术的迅速崛起。 在过去的12个...
-
昇腾CANN 7.0 黑科技:大模型推理部署技术解密
本文分享自华为云社区《昇腾CANN 7.0 黑科技:大模型推理部署技术解密》,作者:昇腾CANN。 近期,随着生成式AI、大模型进入公众视野,越来越多的人意识到抓住AI的爆发就是抓住未来智能化变革的契机。AI基础设施如何快速部署使用,以及如何提升推理性能...
-
英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍、8GB 以上显卡可本地运行,支持 OpenAI 的 Chat API
11 月 16 日消息,微软 Ignite 2023 大会已于今天拉开帷幕,英伟达高管出席本次大会并宣布更新 TensorRT-LLM,添加了对 OpenAI Chat API 的支持。 IT之家今年 10 月报道,英伟达面向数据中心和 Windows...
-
AI视野:微软推自主研发AI芯片Maia100;WPS AI开启公测;OPPO发布安第斯大模型AndesGPT;DeepMind发布新模型Mirasol3B
???AI新鲜事 微软正式宣布其首款人工智能芯片 Maia100 微软宣布推出首款自主研发的AI芯片Maia100,旨在训练大型语言模型,并推出基于Arm架构的通用计算芯片Cobalt100,以优化云计算工作负载。 金山办公WPS AI开启公测,小米14...
-
Altman首次自曝GPT-5加急训练中!暗示比GPT-4更复杂,无法预测真实能力
「OpenAI正在开发下一代大模型GPT-5。我们的意义所在,就是打造超凡脱俗的神奇AI智能」。 这是Sam Altman最近接受FT的一次采访中,首次对外透露了更多OpenAI的计划。 这篇文章信息量巨大! 他不仅谈到了OpenAI的融资想法,英伟达...
-
【2023云栖】黄博远:阿里云人工智能平台PAI年度发布
本文根据2023云栖大会演讲实录整理而成,演讲信息如下: 演讲人:黄博远 | 阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人 演讲主题:阿里云人工智能平台PAI年度发布 AIGC是我们这个时代的新机遇 今年云栖大会,阿里云机器...
-
可与H100一战,微软首款5纳米自研芯片震撼发布!Copilot引爆办公全家桶,Bing Chat改名
微软深夜炸场,万物皆可Copilot! Bing Chat,从此更名Copilot。 登录微软账号,就可以在Copilot专属网站上免费使用GPT-4、DALL·E 3。 图片 OpenAI的全新王牌爆款——自定义GPT,也被塞进Copilot宇宙,变身...
-
ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力
在大模型时代,高质量的代码生成已经强大到,让人惊叹。 从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。 然而,现实中,程序员们不会精炼表达需求,因此误导、限制了LLM生成优秀代码的能力。...
-
[stable-diffusion-art] 指北-4 模型
Beginner's guide to Stable Diffusion models and the ones you should know - Stable Diffusion ArtHow to install, use and merge sta...
-
LLMs之Vicuna:在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub)进行模型权重合并(llama-7b模型与delta模型权重)、模型部
LLMs之Vicuna:在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub 进行模型权重合并(llama-7b模型与delta模型权重 、模型部署且实现模型推理全流程步骤的图文教程(非常详细 ...
-
戳穿人工智能的六个谎言:辨别真伪
译者 | 布加迪 审校 | 重楼 人工智能(AI)无疑是我们这个时代的流行语。特别是随着ChatGPT等生成式AI应用程序的出现,AI大受欢迎,成为了技术大辩论的核心话题。 所有人都在谈论像ChatGPT这样的生成式AI应用程序的影响以及利用它们的能力...
-
LLM 系列 | 21 : Code Llama实战(上篇) : 模型简介与评测
引言 小伙伴们好,我是《小窗幽记机器学习》的小编:卖热干面的小女孩。 个人CSDN首页:JasonLiu1919_面向对象的程序设计,深度学习,C++-CSDN博客 今天开始以2篇小作文介绍代码大语言模型Code Llama。上篇主要介绍Co...
-
足够惊艳,使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调,效果比肩斯坦福羊驼
之前尝试了从0到1复现斯坦福羊驼(Stanford Alpaca 7B),Stanford Alpaca 是在 LLaMA 整个模型上微调,即对预训练模型中的所有参数都进行微调(full fine-tuning)。但该方法对于硬件成本要求仍然偏高且训练低效...
-
AIGC入门 - LLM 信息概览
在阅读本文之前,建议阅读文章:《GPT,GPT-2,GPT-3,InstructGPT的进化之路》 本文将介绍以下 LLM OPT LLaMa Alpaca Vicuna Moss chatGLM Baichuan Openbuddy 一、OPT...
-
比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平
今天我们提到大型语言模型(LLM),第一个想到的就是 OpenAI 的 ChatGPT。一年来,ChatGPT 因其强大的性能,广泛的应用前景而爆火出圈。但谈到大型语言模型,ChatGPT 并不是第一个。 一年前,也就是 OpenAI 发布 ChatGP...
-
微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
世界各地的人们每天都会创造大量视频,包括用户直播的内容、短视频、电影、体育比赛、广告等等。 视频是一种多功能媒介,可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法,就能帮助人们设计出具备强大能力的认知机器 —— 它不...
-
不是LlaMa套壳!李开复麾下大模型陷套壳争议,团队二次回应来了!
整理丨诺亚、小欧 出品 | 51CTO技术栈(微信号:blog51cto) 昨天科技圈社区Hacker News突然出现一则消息,矛头直指不久前发布的大模型Yi-34B,认为其除了两个张量被重新命名外,完全使用了Llama的架构。 图片 而根据公开信息,...
-
大模型幻觉排行榜GPT-4夺冠,英伟达科学家强力打假!Meta版ChatGPT一作发长文鸣冤
大模型的幻觉问题,是业内老生常谈的话题了。 最近,一个名为Vectara的机构,在GitHub推出了一个大模型幻觉排行榜。 结果显示,在总结短文档方面,GPT-4的表现最为优异,而Google Palm的两款模型直接垫底! 其中GPT-4的准确率为97...
-
AI视野:OpenAI暂停ChatGPT Plus用户注册;Bing Chat将推离线模式;C站获510万美元融资;AI智能导购助手京东京言上线
???AI新鲜事 OpenAI暂停ChatGPT Plus用户注册 由于ChatGPT的激增使用量导致服务器负担过大,OpenAI决定暂停新用户注册ChatGPT Plus账号,以确保服务稳定。 微软计划推出Bing Chat离线模式 微软计划通过引入...
-
微软推出 XOT 方法,提升语言模型推理能力
11 月 15 日消息,微软近日推出了名为“Everything of Thought”(XOT)的方法,灵感来自谷歌 DeepMind 的 AlphaZero,利用紧凑的神经网络,来增强 AI 模型推理能力。 微软和佐治亚理工学院、华东师范大学...
-
S-LoRA:一个GPU运行数千大模型成为可能
一般来说,大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是,当针对众多任务(如个性化助手)对 base 模型进行微调时,训练和服务成本会变得非常高昂。低秩适配(LowRank Adaptation,LoRA)是一种参数效率高的微调方法,通常用...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
IBM 推出 Watsonx.governance 以提升企业 AI 模型透明度和治理能力
IBM 今日宣布,旗下产品 Watsonx.governance 将于 12 月初正式面市,旨在帮助企业提升对人工智能模型的透明度,消除数据中的神秘面纱。 在大型语言模型(LLM)或基础模型的推动下,生成式人工智能为企业带来诸多用途,但同时也引发新的风险...
-
OpenAI“疯狂一周”的威力已经影响到各行各业
对于OpenAI来说,上周无疑是比以往更加疯狂的一周。 这家用户数量领先的生成式AI公司在旧金山总部的首次开发者大会DevDay上推出了一系列更新,还宣布开放用户可以在ChatGPT基础上自行构建的定制GPT功能,此外还有OpenAI CEO山姆·奥特...
-
最新本地大模型进展#Chinese-LLaMA-2支持16k长上下文
Hi,今天为大家介绍最新的本地中文语言模型进展。 [2023/08/25] Chinese-LLaMA-2发布了新的更新: 长上下文模型Chinese-LLaMA-2-7B-16K和Chinese-LLaMA-2-13B-16...
-
研究人员教会GPT-4V使用iPhone并在亚马逊应用程序上购物
在当今智能手机技术不断发展的世界中,对能够导航和与移动应用程序复杂界面进行交互的人工智能的需求不断增加。MM-Navigator通过使用GPT-4V代理来满足这一需求,该代理结合了图像处理和文本推理,使其能够在iPhone上执行购物任务。本文将着重介绍MM...
-
WordArt Designer:基于ChatGPT的智能艺术字生成框架
WordArt Designer是一款基于gpt-3.5turbo的艺术字生成框架,旨在通过四个关键模块:LLM引擎、SemTypo、Styltypo和TextTypo,将用户的抽象概念转化为具体的设计。LLM引擎由gpt-3.5turbo驱动,解释用户输...
-
【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca
昨天在github上看到一个在本地部署中文大模型的项目,和大家分享一下。先把地址po出来。 项目名称:中文LLaMA&Alpaca大语言模型+本地部署 (Chinese LLaMA & Alpaca LLMs 项目地址:https://...
-
OpenAI CEO确认GPT-5终极目标:相当于人脑的超级AI
快科技11月14日消息,在最近的一次采访中,OpenAI首席执行官Sam Altman表示,计划从微软获得更多资金支持,用以创造相当于人脑的超级AI通用人工智能(AGI)。 Altman表示,虽然目前OpenAI的GPT-3.5及GPT-4在消费者市场取得...
-
被谷歌收购后,我终于知道为什么大模型竞争落后于OpenAI了
2018 年 3 月,一家科技教育初创 Socratic 被谷歌收购。当时这家仅 10 人的小公司打造了一款家庭作业助手(也被国内媒体称为海外「作业帮」)——学生拍下家庭作业的问题,助手就能帮助解答。除了数学,Socratic 还可以解决科学、文学、社会...
-
GitLab推出对话式AI工具Duo Chat 提升开发效率
在软件开发中,开发人员在处理复杂代码或高效管理项目问题时经常面临挑战。在工作流中找到正确的信息和协助可能是一项难题。为了解决这个问题,GitLab推出了一款名为Duo Chat的新工具,旨在通过将对话式AI整合到现有工作流中简化开发体验。 过去,开发人员已...
-
被OpenAI带火的Agent如何解放人力?清华等发布ProAgent
项目地址:https://github.com/OpenBMB/ProAgent 论文地址:https://github.com/OpenBMB/ProAgent/blob/main/paper/paper.pdf 在历史的长河中,自动化是人类技术...
-
大模型幻觉率排行:GPT-4 3%最低,谷歌Palm竟然高达27.2%
人工智能发展进步神速,但问题频出。OpenAI 新出的 GPT 视觉 API 前脚让人感叹效果极好,后脚又因幻觉问题令人不禁吐槽。 幻觉一直是大模型的致命缺陷。由于数据集庞杂,其中难免会有过时、错误的信息,导致输出质量面临着严峻的考验。过多重复的信息还会...
-
Meta 工程师:明年全球 AI 推理用电量仅需新增两座核电站即可满足
11 月 14 日消息,Meta 生成式人工智能工程总监谢尔盖・埃杜诺夫近日在硅谷数字工人论坛上分享了他对人工智能推理需求的预测。他认为,明年全球新增的人工智能应用推理需求,如果使用合理规模的语言模型,仅需两座核电站的发电量就可以满足。 人工智能推理是...
-
苹果筹备 iPhone 16 Pro 的 AI 功能应对智能手机 AI 竞赛的挑战
随着 Google、高通和三星在其旗舰智能手机中大力推广 AI 技术,苹果公司面临在即将推出的 iPhone 16 Pro 中整合 AI 技术的紧迫挑战。 据 Bloomberg 的 Mark Gurman 报道,由于 iPhone 16 和 16 Pr...
-
Silo AI面向欧洲推新开源语言模型“Poro” 涵盖欧盟24种语言
芬兰赫尔辛基的人工智能初创公司Silo AI本周发布了Poro,这是一个旨在提升欧洲语言多语言人工智能能力的新开源大型语言模型(LLM)。Poro是计划中的首个开源模型,旨在最终涵盖欧盟所有24种官方语言。这些模型由Silo AI的SiloGen生成人工智...