-
IBM 启动5亿美元企业人工智能风险基金,以支持初创公司
IBM近日推出新的企业投资工具,即企业人工智能风险基金,计划通过该基金支持那些开发以企业为重点的人工智能产品的初创公司。 其他科技巨头在IBM此举之前也加大了对人工智能创业生态系统的投资。几周前,大型语言模型开发商Anthropic PBC从亚马逊公司和...
-
微软推出 XOT 方法,提升语言模型推理能力
11 月 15 日消息,微软近日推出了名为“Everything of Thought”(XOT)的方法,灵感来自谷歌 DeepMind 的 AlphaZero,利用紧凑的神经网络,来增强 AI 模型推理能力。 微软和佐治亚理工学院、华东师范大学...
-
S-LoRA:一个GPU运行数千大模型成为可能
一般来说,大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是,当针对众多任务(如个性化助手)对 base 模型进行微调时,训练和服务成本会变得非常高昂。低秩适配(LowRank Adaptation,LoRA)是一种参数效率高的微调方法,通常用...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
IBM 推出 Watsonx.governance 以提升企业 AI 模型透明度和治理能力
IBM 今日宣布,旗下产品 Watsonx.governance 将于 12 月初正式面市,旨在帮助企业提升对人工智能模型的透明度,消除数据中的神秘面纱。 在大型语言模型(LLM)或基础模型的推动下,生成式人工智能为企业带来诸多用途,但同时也引发新的风险...
-
OpenAI“疯狂一周”的威力已经影响到各行各业
对于OpenAI来说,上周无疑是比以往更加疯狂的一周。 这家用户数量领先的生成式AI公司在旧金山总部的首次开发者大会DevDay上推出了一系列更新,还宣布开放用户可以在ChatGPT基础上自行构建的定制GPT功能,此外还有OpenAI CEO山姆·奥特...
-
Ghostbuster:一个准确度高的AI生成文本检测工具
大语言模型如ChatGPT,以其卓越的写作能力引发了问题。学生们纷纷利用这些模型代写作业,导致一些学校不得不采取禁止ChatGPT的措施。此外,这些模型还存在生成带有事实错误的文本的倾向,因此谨慎的读者可能想知道,在信任某些新闻文章或其他来源之前,是否有生...
-
最新本地大模型进展#Chinese-LLaMA-2支持16k长上下文
Hi,今天为大家介绍最新的本地中文语言模型进展。 [2023/08/25] Chinese-LLaMA-2发布了新的更新: 长上下文模型Chinese-LLaMA-2-7B-16K和Chinese-LLaMA-2-13B-16...
-
研究人员教会GPT-4V使用iPhone并在亚马逊应用程序上购物
在当今智能手机技术不断发展的世界中,对能够导航和与移动应用程序复杂界面进行交互的人工智能的需求不断增加。MM-Navigator通过使用GPT-4V代理来满足这一需求,该代理结合了图像处理和文本推理,使其能够在iPhone上执行购物任务。本文将着重介绍MM...
-
WordArt Designer:基于ChatGPT的智能艺术字生成框架
WordArt Designer是一款基于gpt-3.5turbo的艺术字生成框架,旨在通过四个关键模块:LLM引擎、SemTypo、Styltypo和TextTypo,将用户的抽象概念转化为具体的设计。LLM引擎由gpt-3.5turbo驱动,解释用户输...
-
【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca
昨天在github上看到一个在本地部署中文大模型的项目,和大家分享一下。先把地址po出来。 项目名称:中文LLaMA&Alpaca大语言模型+本地部署 (Chinese LLaMA & Alpaca LLMs 项目地址:https://...
-
[算法前沿]--000-大模型LLaMA在docker环境搭建以及运行教程(含模型压缩)
文章目录 LLaMA 论文 步骤 搭建步骤 运行7B模型 运行13B模型 未来已来,大模型依据压缩模型的方式,可以在普通的PC上运行. LLaMA Facebook的LLaMA 模型和Georgi Gerganov 的ll...
-
OpenAI CEO确认GPT-5终极目标:相当于人脑的超级AI
快科技11月14日消息,在最近的一次采访中,OpenAI首席执行官Sam Altman表示,计划从微软获得更多资金支持,用以创造相当于人脑的超级AI通用人工智能(AGI)。 Altman表示,虽然目前OpenAI的GPT-3.5及GPT-4在消费者市场取得...
-
施耐德电气通过集成Azure OpenAI推动生成式人工智能解决方案
由法国能源管理与自动化数字化转型领导者施耐德电气牵头,与科技巨头Microsoft合作,通过整合Microsoft Azure OpenAI,推动生成式人工智能(GenAI)解决方案,以提高生产力和可持续性。这一合作旨在重塑操作流程,简化繁琐任务,优化资源...
-
Meta 工程师:明年全球 AI 推理用电量仅需新增两座核电站即可满足
11 月 14 日消息,Meta 生成式人工智能工程总监谢尔盖・埃杜诺夫近日在硅谷数字工人论坛上分享了他对人工智能推理需求的预测。他认为,明年全球新增的人工智能应用推理需求,如果使用合理规模的语言模型,仅需两座核电站的发电量就可以满足。 人工智能推理是...
-
苹果筹备 iPhone 16 Pro 的 AI 功能应对智能手机 AI 竞赛的挑战
随着 Google、高通和三星在其旗舰智能手机中大力推广 AI 技术,苹果公司面临在即将推出的 iPhone 16 Pro 中整合 AI 技术的紧迫挑战。 据 Bloomberg 的 Mark Gurman 报道,由于 iPhone 16 和 16 Pr...
-
Meta工程师称全球AI推理用电仅需新增两座核电站即可满足
近日,Meta公司的生成式人工智能工程总监谢尔盖·埃杜诺夫在硅谷数字工人论坛上透露,为满足明年全球不断增长的人工智能应用推理需求,仅需新增两座核电站的发电量即可。 埃杜诺夫表示,他仅通过简单的数学计算得出这个结果。他专门分析了人工智能“推理”阶段的用电量。...
-
GPT-5已开工!奥特曼:月入7亿不够烧,希望微软再投点
月入7个亿,仍然覆盖不了训练GPT的海量投入。 这是OpenAI CEO奥特曼公开透露的最新信息。 他对《金融时报》表示,OpenAI今年收入增长良好,但公司仍未盈利。OpenAI计划继续从金主爸爸微软和其他投资者那里筹集资金—— 而就在今年初,已有微...
-
Silo AI面向欧洲推新开源语言模型“Poro” 涵盖欧盟24种语言
芬兰赫尔辛基的人工智能初创公司Silo AI本周发布了Poro,这是一个旨在提升欧洲语言多语言人工智能能力的新开源大型语言模型(LLM)。Poro是计划中的首个开源模型,旨在最终涵盖欧盟所有24种官方语言。这些模型由Silo AI的SiloGen生成人工智...
-
LLM系列 | 19 : Llama 2实战(上篇)-本地部署(附代码)
简介 小伙伴们好,我是《小窗幽记机器学习》的小编:卖热干面的小女孩。紧接前文:万字长文细说ChatGPT的前世今生,后续会尝试以理论+实践的方式逐步对主流的各大LLM进行实测和汉化。今天这篇关于Llama2的小作文其实比较长,所以分为上下两篇,上篇...
-
OpenAI新功能揭秘:多模态时代的到来
作者 | 崔皓 审校 | 重楼 摘要 本文介绍了OpenAI的最新进展,重点关注其在多模态技术领域的突破。文章首先探讨了GPT-4 Turbo模型的优化和多模态功能的融合,如图像生成和文本到语音转换。随后,作者深入解析多模态技术的工作原理,特别是文本到图...
-
企业对生成式AI的投资低得惊人 在云支出中占比不到1%
2023年,生成式AI备受关注,被认为是能够在多个领域实现变革的突破性技术,甚至被寄予改变人类生活的希望。然而,Menlo Ventures报告显示,尽管生成式AI在2023年取得突破,但这主要是一场炒作。 报告指出,生成式AI在企业云支出中所占比例“相对...
-
Visa巧用AI防御系统对抗假日购物季欺诈
在即将到来的假日购物季,全球支付领导者Visa既迎来了销售额的大幅增长,也迎来了网络犯罪分子的猖獗攻击。 Visa首席风险官Paul Fabara在接受VentureBeat独家采访时表示:“从历史经验来看,假日购物季对欺诈分子而言就如同超级碗一般,因为支...
-
老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭
英伟达的节奏,越来越可怕了。 就在刚刚,老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200! 较前任霸主H100,H200的性能直接提升了60%到90%。 不仅如此,这两款芯片还是互相兼容的。这意味着,使用H100训练/推理模型的企业,可以无缝更...
-
刚刚,出行行业首个!百亿估值玩家联合国有运营商开卷大模型
首个落地的交通出行大模型,它来了! 这两年的出行行业,有的卷补贴、规模,有的卷自动驾驶、卷定制车,终于有人开始卷大模型了! 名为“阡陌”,背后是国家队级别的选手:T3出行和中国电信。 T3出行,出行领域快速崛起的明星玩家,曾创造77亿元融资业内纪录,估值早...
-
【PaLM2】PaLM2 大语言模型与 Bard 使用体验
欢迎关注【youcans的学习笔记】原创作品,火热更新中 【Google I/O 2023】PaLM2 大语言模型与 Bard 使用体验 1. PaLM2 大型语言模型 1.1 谷歌发布 PaLM2 1.2 PaLM2 的功能与性能...
-
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
可以说,AI 初创公司 LinkSoul.Al 的这些开源项目让海外开源大模型在国内的普及和推广速度与国际几乎保持了一致。 7 月 19 日,Meta 终于发布了免费可商用版本 Llama 2,让开源大模型领域的格局发生了巨大变化。 Llama 2 模...
-
openai开源的whisper在huggingface中使用例子(语音转文字中文)
openai开源的语音转文字支持多语言在huggingface中使用例子。 目前发现多语言模型large-v2支持中文是繁体,因此需要繁体转简体。 后续编写微调训练例子 GitHub地址: https://github.com/openai/whispe...
-
腾讯云部署清华大学ChatGLM-6B实战
简介(来自官方) ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只...
-
谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析
Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。 网友看了之后纷纷表示: 「终于,他们发了点普通人能看懂的东西了」。 「哦豁,这下懂了」 「对,就是这么简单!」 「太...
-
UNC斯坦福等曝光GPT-4V意外漏洞,被人类哄骗数出8个葫芦娃!LeCun和Jim Fan震惊了
GPT-4V诞生后,惊艳的多模态能力让网友惊呼连连,连OpenAI总裁Greg Brockman都不断在X上安利。 不过,最近大家发现,只要打乱布局,GPT-4V就会被曾经解决的著名计算机视觉难题——「吉娃娃还是松饼」,再次难倒…… UCSC教授Xin...
-
全球各行业公司纷纷发布GPT-4相关职位
大型语言模型(LLM)领域正在迅速增长,对深度学习、机器学习、自然语言处理(NLP 等领域的专业人才需求不断上升。随着越来越多的公司采用聊天机器人和其他LLM人工智能技术来提高客户服务和运营效率,对于开发、维护和操作这些系统的才华横溢的个体的需求也在增加。...
-
LoRAShear:微软在LLM修剪和知识恢复方面的最新研究
LoRAShear是微软为优化语言模型模型(llm 和保存知识而开发的一种新方法。它可以进行结构性修剪,减少计算需求并提高效率。 LHSPG技术( Lora Half-Space Projected Gradient)支持渐进式结构化剪枝和动态知识恢复...
-
GPT Builder如何下载?创建GPTs还需要prompt吗
在上周的开发者大会DevDay上,OpenAI向所有ChatGPTPlus订阅者发布了其新的招牌工具之一GPTBuilder。正如名称所示,OpenAI的GPTBuilder允许个人构建自己的ChatGPT定制版本,ChatGPT是该公司热门的大型语言模型...
-
详解超强ResNet变体NFNet:抛弃归一化后,性能却达到了最强!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从上古时期一直到今天,Batch Norm (BN 一直都是视觉骨干架构里面很重要的一个环节。BN 使得研究人员可以训练更深的网络,并在训练集和测试集上实现更高的精度。Batch Norm 还可以平...
-
LLaMA系列 | LLaMA和LLaMA-2精简总结
文章目录 1、LLaMA 1.1、模型结构 1.2、训练方式 1.3、结论 2、LLaMA-2 2.1、相比LLaMA1的升级 2.3、模型结构 2.3.1、MHA, MQA, GQA区别与联系 2.4、训练方式 1、L...
-
2024 年智能手机 AI 功能竞争激烈升温:iPhone 16 将引发与三星 Galaxy S24 的人工智能竞争
预备迎接新一轮人工智能竞争的到来,苹果公司和三星电子正准备在 2024 年展开一场高风险的较量。据最新泄露信息显示,iPhone 16 可能将与 Samsung Galaxy S24 正面交锋。Galaxy S24 系列预计将引入前沿的设备内和基于云的 A...
-
2028年人类将迎来AGI:DeepMind联合创始人长文预测未来AI发展
10月26日,在X上有三万订阅的Dwarkesh Podcast(矮人播客)主持人Dwarkesh Patel采访了谷歌DeepMind的创始人兼首席AGI科学家Shane Legg。 他们讨论了AGI出现的时间节点、可能的AGI新架构、作为下一个行业标...
-
谷歌DeepMind给AGI划等级,猜猜ChatGPT在哪个位置
我们到底该如何定义 AGI(通用人工智能)?如果你要求 100 位 AI 专家进行解答,你可能会得到 100 个相关但不同的定义。 现阶段,AGI 是 AI 研究中一个重要且存在争议的概念,有研究者认为 AGI 已经出现在最新一代大语言模型(LLM)中;...
-
斯坦福提出对比偏好学习:无需强化学习即可从人类反馈中学习
在模型与人类意图对齐方面,根据人类反馈的强化学习(RLHF)已经成为一大流行范式。通常来说,RLHF 算法的工作过程分为两个阶段:一、使用人类偏好学习一个奖励函数;二、通过使用强化学习优化所学习的奖励来对齐模型。 RLHF 范式假定人类偏好的分布遵照奖励...
-
GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒
在最新的人工智能领域动态中,人工生成的提示(prompt)质量对大语言模型(LLM)的响应精度有着决定性影响。OpenAI 提出的建议指出,精确、详细且具体的问题对于这些大语言模型的表现至关重要。然而,普通用户是否能够确保他们的问题对于 LLM 来说足够...
-
企业不会用、不敢用AIGC+ 服务怎么办,不妨试一下它?
自从去年ChatGPT上线后,国内外与AIGC相关的话题就一直备受关注。AIGC是指人工智能通用语言模型(Artificial General Language Model ,是一种具有极高自然语言理解能力的人工智能模型,其通过大规模语料库训练,能够像人类...
-
能跟「猫主子」聊天了!生成式AI带来的全面革命:最快五年内破译第一种动物语言
所罗门能够与动物交流并不是因为他拥有魔法物品,而是因为他有观察的天赋。 ——康拉德・劳伦兹《所罗门王的指环》 在《狮子王》、《疯狂动物城》等以动物为中心的作品中,作者...
-
人手一个 Midjourney,StableStudio 重磅开源!
人手一个 Midjourney,StableStudio 重磅开源! Stability AI 公司在上个月 19 号推出了 Alpha 版本 StableLM 大语言模型,包含了 30 亿和 70 亿参数,并且支持商用。如今他们再次推出了 AI 图像...
-
五个可以无限免费的AI写作工具
目前有不少优秀的AI写作助手工具,为用户提供免费的写作生成服务。我推荐5个无限免费的AI写工具如下: 1. ChatGPT: 这是OpenAI研发的大规模语言模型,可以进行智能写作和创意脑storm。它可以根据提示生成不同格式、风格的长文本,如故事、说...
-
AIGC技术周报|为文生图模型提供“参考”;交互式prompt系统:让文生图模型更懂你
AIGC通过借鉴现有的、人类创造的内容来快速完成内容创作。ChatGPT、Bard等AI聊天机器人以及Dall·E 2、Stable Diffusion等文生图模型都属于AIGC的典型案例。「AIGC技术周报」将为你带来最新的paper、博客等前瞻性研究。...
-
【网安AIGC专题10.11】2 ILF利用人类编写的 自然语言反馈 来训练代码生成模型:自动化反馈生成+多步反馈合并+处理多错误反馈+CODEGEN -M ONO 6.1 B model
Improving Code Generation by Training with Natural Language Feedback 写在最前面 主要工作 启发 背景介绍 应用 现有工作的不足 Motivation动机 方法 ILF...
-
Meta的LLama模型非官方下载方法
简介 Llama模型是一个用于自然语言处理的大型语言模型,它由Meta AI开发,拥有65亿个参数。该模型的目的是帮助研究者在AI的子领域中推进他们的工作。Llama模型结构巨大,最小的模型LLaMA 7B也经过了超过1万亿个代币的训练。Llama模型...
-
【人工智能】ChatGTP从入门到精通
当谈论自然语言处理和文本生成技术时,Chat GPT 是一个备受瞩目的话题。作为一种基于深度学习的语言模型,Chat GPT 在近几年里已经展现出了惊人的能力,可以生成几乎无法区分与人类写作的文本,并在自然语言处理领域的各种任务中都表现出色。Chat GP...
-
百度「文心一言」阿里「通义千问」腾讯的AI将会叫什么呢
阿里于昨天2023.4.7下午上线通义千问,与ChatGPT类似,同样是基于语言模型训练的人工智能聊天平台。通义千问的核心功能分为四个大类:撰写短文、职场助理、电影脚本和写封邮件。 通义千问通义千问https://tongyi.aliyun.com/...