-
AIGC时代高效阅读论文实操
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
AIGC内容分享(四十一):国内AIGC独角兽冲出几家?
目录 2023年新晋AI独角兽 智谱AI:清华计算机系KEG科研成果 百川智能:原搜狗CEO王小川创业项目 零一万物:李开复筹建的新项目 Minimax:前商汤副总裁创业项目 结尾: 2023年新晋AI独角兽 根据IT桔子数据,截...
-
[AI]文心一言出圈的同时,NLP处理下的ChatGPT-4.5最新资讯
前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家:https://www.captainbed.cn/z ChatGPT体验地址 文章目录 前言 4.5key价格泄漏 ChatGPT4.0使...
-
LLaMA模型泄露 Meta成最大受益者
一份被意外泄露的谷歌内部文件,将Meta的LLaMA大模型“非故意开源”事件再次推到大众面前。“泄密文件”的作者据悉是谷歌内部的一位研究员,他大胆指出,开源力量正在填平OpenAI与谷歌等大模型巨头们数年来筑起的护城河,而最大的受益者是Meta,因为该公司...
-
劈柴曝谷歌2024年全年裁员,牵出华人员工自杀事件!硅谷近8000人疑被AI淘汰
硅谷一年一度的开年裁员大礼包,又来了。 目前,谷歌的裁员动荡,还在继续。就在今天,CEO劈柴又发出了全员公开信,表示裁员将持续2024一整年! 1月10号以来,谷歌已经有多部门的近1000名员工被裁。谷歌硬件、广告销售、搜索、购物、地图、政策、核心工程...
-
马毅LeCun谢赛宁曝出多模态LLM重大缺陷!开创性研究显著增强视觉理解能力
Sam Altman在各种场合都提到,大语言模型的多模态能力,是未来AI技术能够造福人类的最亟待突破的领域。 那么现在在多模态大模型的视觉功能能否达到与语言功能匹配的水平? 当前多模态模型取得的进步很大程度上归功于大语言模型(LLM)的推理能力。但在视...
-
【论文简介】Stable Diffusion的基础论文:2112.High-Resolution Image Synthesis with Latent Diffusion Models
稳定扩散生成模型(Stable Diffusion 是一种潜在的文本到图像扩散模型,能够在给定任何文本输入的情况下生成照片般逼真的图像 Stable Diffusion 是基于latent-diffusion 并与 Stability AI and Run...
-
Whisper与ChatGPT联手,轻松实现音频转录文本
目录 前言 一、Whisper简介 二、Whisper可用的模型和语言 三、开源 Whisper 本地转录 3.1、安装pytube库 3.2、下载音频MP4文件 3.3、安装 Whisper 库 四、在线 Whisper API 转录...
-
【周末闲谈】人工智能热潮下的AIGC到底指的是什么?
生成式人工智能AIGC(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。 个人主页:【?个人主页】 系列专栏:【❤️周末闲谈】 系列目录 ✨第一周 二进制V...
-
如何高效部署大模型?CMU最新万字综述纵览LLM推理MLSys优化技术
在人工智能(AI)的快速发展背景下,大语言模型(LLMs)凭借其在语言相关任务上的杰出表现,已成为 AI 领域的重要推动力。然而,随着这些模型在各种应用中的普及,它们的复杂性和规模也为其部署和服务带来了前所未有的挑战。LLM 部署和服务面临着密集的计算强...
-
谷歌千人被裁引硅谷裁员潮!27家公司宣布裁员,90%大厂码农工作遭AI冲击
过去一年,AI大模型如火如荼的发展,让所有人憧憬着美好未来。 没想到2024年的开启,却是硅谷大裁员! 大厂谷歌却是首当其冲,裁员1000多人,涉及了核心工程、谷歌助理、Pixel手机等硬件团队的人员。 截至2023年9月30日,谷歌拥有18.2万名员工...
-
驾驭AI绘画:《AI魔法绘画》带你秒变顶级画手!
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
机器人又拿下一种家务:10小时学会煮咖啡,仅需观看人类演示视频
上周斯坦福炒虾机器人炸场之后,又火了一个煮咖啡机器人。 它的厉害之处在于通过观看人类的示范视频,仅需10小时端到端训练,就能学会并完全自主搞定这一任务。 当然,更准确地来说是操作咖啡机: 只见它打开机盖、放入咖啡包,再按下开始按钮,整个过程一气呵成,无...
-
AI画中国退休老太太微博大火!「傻鹅之王」和快乐小狗挑战GPT-4想象力极限
AI的创造力到底极限在哪里? 最近网友发现,只要适时地给GPT-4来点PUA,就能让它将自己想象力和创造力的极限给激发出来。 前段时间,「AI冷课长」用AI画的不同退休金的中国老太太,一度登上微博热搜。 给出的指令从「画一个没有退休金的中国老太太」、到「...
-
谷歌DeepMind机器人成果三连发!两大能力全提升,数据收集系统可同时管理20个机器人
几乎是和斯坦福“炒虾洗碗”机器人同一时间,谷歌DeepMind也发布了最新具身智能成果。 并且是三连发: 先是一个主打提高决策速度的新模型,让机器人的操作速度(相比原来的Robotics Transformer)提高了14%——快的同时,质量也没有下滑...
-
斯坦福炒虾机器人爆火全网!华人团队成本22万元,能做满汉全席还会洗碗
今天,会做一大桌子菜的斯坦福机器人Mobile ALOHA刷屏全网。 滑蛋虾仁、干贝烧鸡、蚝油生菜,色香味俱全,看着很诱人。 就拿滑蛋虾仁这道菜来说,Mobile ALOHA在烧水的过程中先打上3颗鸡蛋,然后把虾仁放到水中焯熟,平底锅倒入鸡蛋液再加入...
-
AI视野:通义千问上线通义舞王;斯坦福炒虾机器人爆火;Midjourney艺术家数据库泄露;Meta发布AI调试工具HawkEye;小冰大模型获备案
新鲜AI产品点击了解:https://top.aibase.com/ ???AI应用 通义千问上线通义舞王 阿里云通义千问APP近日上线了一项名为“通义舞王”的免费功能,用户只需在APP内输入相应口令并上传照片,系统即可生成个性化的舞蹈视频。 Meta发...
-
ChatGPT在儿科疾病诊断中错误率高达83%
发表在《美国医学会儿科杂志》上的一项研究表明,ChatGPT-4在儿科医学病例的诊断方面的准确率仅为17%,较去年一般医学病例的39%更低。 这一低成功率显示出人类儿科医生在短时间内不太可能失业的现实,研究强调了临床经验在医学领域的不可替代性。研究人员指出...
-
黑客解锁特斯拉自动驾驶系统的“隐藏模式”
在近日举行的混沌计算大会上,来自柏林工业大学的三名网络安全研究人员演示了如何通过“电压故障攻击”成功破解特斯拉的自动驾驶系统,不但能获取系统和用户敏感数据,而且解锁了特斯拉自动驾驶的隐藏模式——“Elon模式”。 特斯拉自动驾驶的隐藏模式——“Elon...
-
AI识别出地震先兆信号?机器学习发现数据神秘关联,人类有望预测地震
最近一段时间,世界各地地震频发。 就在1月1日,日本突发里氏7.6级的地震,随后陆续有灾情传出。据统计,目前至少已有62人死亡。 而下面这个问题,也再一次被提起:人类究竟什么时候能及时预测地震呢? 别急,已经在进步了。 现在,在用AI和其他技术及时预测...
-
大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉
大型语言模型(LLM)虽然在诸多下游任务上展现出卓越的能力,但其实际应用还存在一些问题。其中,LLM 的「幻觉(hallucination)」问题是一个重要缺陷。 幻觉是指由人工智能算法生成看似合理但却虚假或有误导性的响应。自 LLM 爆火以来,研究人员...
-
脑机结合时代即将到来 人类文明将会飞速发展
作者 | 洪涛、奥托·麦克 作者均为美国佐治亚理工学院博士后 人类历史上,每一次重大的技术革命,都会引发对人类自身乃至整个社会的冲击;脑机接口(BCI 也一样,对人类社会来说,这门高新科技将会引发一场新的社会变革的风暴。正如国际知名学者周海中先生1995...
-
IEEE计算机协会发布2023技术趋势预测评估
领先的计算机科学和工程成员社区IEEE计算机协会(CS 的领导人宣布了年度技术排名计分卡,并根据当前的技术状态评估年初所做的2023年技术趋势预测。今年,基于人工智能的解决方案在他们的评估中排名最高。 2014年IEEE CS总裁、现任惠普研究员兼惠普...
-
谁能撼动Transformer统治地位?Mamba作者谈LLM未来架构
在大模型领域,一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。 这个挑战者就是一项名为「Mamba」的研究,其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面,无论是预训练还是下游评估,Mamba-3B 模...
-
阿里发布《AIGC治理与实践白皮书》AI发展需要“防火墙+天花板”
12月27日,北京举行的AI发展与治理创新研讨会成为全球科技关注的焦点。在会上,阿里巴巴集团携手中国电子技术标准化研究院共同发布了《AIGC治理与实践白皮书》,标志着中国在人工智能治理领域取得了新的重要进展。 阿里巴巴科技伦理治理委员会负责人在发布会上表示...
-
2024年我期待的五个AI故事
在OpenAI于2022年11月发布ChatGPT之后,我喜欢称之为AI新闻的持续“海啸”,我不必等待很长时间:从GPT-4和欧盟AI法案到AI搜索之战,开放与封闭AI之争,以及对训练数据和计算能力的渴望,我多次写下了所有这些话题。 现在,距离新年只有...
-
谷歌创始人亲自给Gemini写代码,很核心那种
身价1050亿美元,每天还在亲自动手敲代码!? 就连谷歌最新大招Gemini大模型的核心贡献者名单中,也有他的名字。 没错,他就是谷歌联合创始人谢尔盖·布林(Sergey Brin)。 千亿富翁大老板亲自下场敲代码已是少见,更何况频率是“几乎每天”,这事...
-
自研大模型上车双足机器人,西湖大学系具身智能曝光
双足机器人赛道,又迎来一名搭载AI大模型的玩家。 西湖机器人,西湖大学机器智能实验室的转化项目,被曝将重点涉猎双足机器人领域,并且是搭载GPT大模型的版本,以行为/轨迹为核心那种。 目前,该公司在市场的大概估值在1-2亿左右。 还有来自市场的消息表示,因...
-
用生物脑机制启发持续学习,让智能系统适者生存,清华朱军等团队研究登Nature子刊封面
在开放、高动态和演化环境中的学习能力是生物智能的核心要素之一,也是人类以及大多数动物在「适者生存」的自然选择过程中形成的重要优势。目前传统机器学习范式是在静态和封闭的数据集上学习到一个模型,并假设其应用环境和之前训练数据的属性相同,因而无法适应动态开放环...
-
ChatGPT构建离不开PyTorch,LeCun言论引热议,模型厂商不开放权重原来为此
这两天,有关开源的话题又火了起来。有人表示,「没有开源,AI 将一无所有,继续保持 AI 开放。」这个观点得到了很多人的赞同,其中包括图灵奖得主、Meta 首席科学家 Yann LeCun。 想象一下,如果工业界的 AI 研究实验室仍然封闭、没有开源代码...
-
GPT-4.5秘密解禁?网友灰度测试全网热议,OpenAI研究员回应全是幻觉
GPT-4.5,难道已经瞒着我们悄悄上线了? 最近,许多网友都发现了一件令人震惊的事情。 图片 如果问ChatGPT「你在API里是如何命名的」,它居然会回答,自己的名字是「gpt-4.5-turbo」! 图片 而且,不少网友都有类似的发现: 图片 图片...
-
哀悼!55岁商汤科技创始人汤晓鸥突然离世,他撑起中国计算机视觉研究半壁江山
沉痛悼念! 2023年12月15日23时45分,商汤科技创始人汤晓鸥教授因病救治无效不幸离世,终年55岁。 天妒英才,继孙剑博士2年前意外辞世后,中国AI界再失一位领军人物。 计算机视觉的开拓者 毫不夸张地说,汤晓鸥教授是中国计算机视觉的开拓者和探路...
-
AI人才供不应求 ChatGPT研究员平均月薪6.7万元
快科技12月16日消息,脉脉发布的《2023年度人才迁徙报告》显示,ChatGPT研究员以平均月薪6.7万元位列高薪榜榜首。 AI相关岗位人才供不应求,在高薪岗位TOP20中,以ChatGPT研究员、算法、深度学习为代表的AI岗位拥有10席,占了半壁江山...
-
Google Cloud 与 Mistral AI 合作,支持其大型语言模型在谷歌云基础设施上分发
Google Cloud 和巴黎的生成型 AI 初创公司 Mistral AI 当地时间周三联合宣布合作,允许这家初创公司在科技巨头的基础设施上分发其语言模型。 根据双方的联合声明,「根据协议,Mistral AI 将使用 Google Cloud 的...
-
一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”
斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作! 仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景: 只需输入一段古诗词,诗中场景立刻映入眼帘: 而且还是来回式的,可以再倒回去的那种: 同一起点可以进入不同场景: 真实场景也可以,其中的...
-
消息称 Meta 无视自家律师警告,使用盗版书籍训练 AI 模型
12 月 13 日消息,据路透社报道,根据一起版权侵权诉讼的新文件显示,Meta Platforms 在明知使用数千本盗版书籍训练其 AI 模型存在法律风险的情况下,仍然一意孤行。 据IT之家了解,该诉讼由喜剧演员 Sarah Silverman、普...
-
AI视野:Midjourney正式上线Alpha网页版;OpenAI恢复会员注册;腾讯发布视频生成模型AnimateZero;微软发布小语言模型AI Phi-2
???AI应用 Midjourney正式上线Alpha网页版!支持已生成图片设置参数回填 Midjourney Alpha全新升级,生成用户界面更便捷,成功生成1万张图片即可获得权限,可视化图像参数支持点击回填到提示词输入框,提升生成体验。 截图自归藏...
-
马斯克摊上事了!Grok AI被爆疑似抄袭ChatGPT??
大家好,我是二狗。 马斯克今天摊上事了! X(推特)一名网友爆料,马斯克旗下xAI公司研发的Grok AI疑似“抄袭”ChatGPT。 Grok 在回答网友的一个问题时,做出了令人震惊的“承认”: “恐怕我无法满足该请求,因为它违反了OpenAI的用例政...
-
研究人员薪酬最高的13家人工智能公司:OpenAI居首
人工智能显然是目前最热门的行业。在 OpenAI 或 DeepMind 等世界顶级人工智能公司工作是很多人梦寐以求的事情。但你有没有想过,在这些公司工作的年薪有会是多少呢?? Rora公布了薪资协商报告,给出了各家AI公司给其研究人员的薪资情况。以下是13...
-
ChatGPT 还是谷歌 Gemini 更好?新 AI 模型尽管性能卓越但面临现实应用的挑战
谷歌最近推出了一款名为 Gemini 的新型人工智能模型,并试图通过一份报告证明其优于 OpenAI 的 GPT-4。根据谷歌首席执行官 Sundar Pichai 联合撰写的一篇博客文章,Gemini 在 32 项学术基准测试中的 30 项中表现优于 G...
-
夸张!EMNLP投稿近5000篇,奖项出炉:北大、腾讯摘最佳长论文
EMNLP 是自然语言处理领域的顶级会议之一,EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。 因为今年 ChatGPT 的爆火带动大模型、NLP 概念,EMNLP 2023 的投稿论文数量也达到近 5000 篇,甚至略高于 AC...
-
杭州一公司开出20万月薪/320万年薪抢人!ChatGPT掀起AI热潮,AIGC人才被爆抢
5年工作经历,博士学位,最高月薪20万。 最近,位于杭州未来科技城一家公司,开出了最高320万年薪,招聘AIGC方向算法工程师一名。 ChatGPT在全球掀起了AI热潮,国内互联网大厂纷纷加入战局打造国内版ChatGPT。很多人在担心失业的同时,AI人...
-
大模型就是「造梦机」,Karpathy一语惊人!人类才是「幻觉问题」根本原因
幻觉,早已成为LLM老生常谈的问题。 然而,OpenAI科学家Andrej Karpathy今早关于大模型幻觉的解释,观点惊人,掀起非常激烈的讨论。 在Karpathy看来: 另外,Karpathy的另一句话,更是被许多人奉为经典。他认为,与大模型相对的...
-
首个精通3D任务的具身通才智能体:感知、推理、规划、行动统统拿下
想要迈向通用人工智能,必须要构建一个能够理解人类生活的真实世界,并掌握丰富技能的具身通用智能体。 今年以来,以 GPT-4 (V [1]、LLaVA [2]、PALM-E [3] 等为代表的多模态大语言模型(Multi-modal Large Langu...
-
AIGC(Artificial Intelligence Generated Content)和 Web3对比,未来发展
一、AIGC(Artificial Intelligence Generated Content)行业 历史背景 AIGC(Artificial Intelligence Generated Content)是指利用人工智能技术生成的内容。随着人工智...
-
后期狂喜!一张照片丝滑替换视频主角,动作幅度再大也OK|Meta&新加坡国立大学
后期狂喜了家人们~ 现在,只需一张图片就能替换视频主角,效果还是如此的丝滑! 且看这个叫做“VideoSwap”的新视频编辑模型—— 小猫一键变小狗,基操~ 如果原物体本身扭动幅度大一些?也完全没问题: 细看俩者之间的运动轨迹,给你保持得是一毛一样:...
-
使用 LoRA 进行 Stable Diffusion 的高效参数微调
LoRA: Low-Rank Adaptation of Large Language Models 是微软研究员引入的一项新技术,主要用于处理大模型微调的问题。目前超过数十亿以上参数的具有强能力的大模型 (例如 GPT-3 通常在为了适应其下游任...
-
大模型免微调解锁对话能力,RLHF没必要了!一作上交大校友:节省大量成本和时间
要搞大模型AI助手,像ChatGPT一样对齐微调已经是行业标准做法,通常分为SFT+RLHF两步走。 来自艾伦研究所的新研究却发现,这两步都不是必要的??? 新论文指出,预训练完成刚出炉的基础模型已经掌握了遵循指令的能力,只需要提示工程就能引导出来,引起...
-
大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种
大模型的“5年高考3年模拟”数学题来了,还是加强强强版! 微软、加州大学洛杉矶分校(UCLA)、华盛顿大学(UW)联合打造全新多模态数学推理基准数据集。 名为“MathVista”。 涵盖各种题型共6141个问题,来源于28个现有的多模态数据集和3个新标...
-
GPT-4 未通过图灵测试,GPT-3.5 还败给六十年前的老 AI 系统,最新研究出炉!
过去一年间,能说会道的ChatGPT、最新的 GPT-4大模型,其能力也已超乎很多人的想象,一场由 OpenAI 引领推动的 AIGC 浪潮席卷全球各大科技公司。但是从学术研究的角度来看,其表现力距离人类智能究竟还有多远? 近日,一篇由加州大学圣迭戈分校的...