-
NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜
近日,作为美国前十的科技博客,Latent Space对于刚刚过去的NeurIPS 2023大会进行了精选回顾总结。 在NeurIPS会议总共接受的3586篇论文之中,除去6篇获奖论文,其他论文也同样优秀和具有潜力,甚至有可能预示着下一个AI领域的新突破...
-
整理一下最近了解到的AIGC工具
AIGC工具的一点整理 前言 AIGC类型 图像生成类 Stable diffusion Midjourney DALL·E 2 三种工具比较 DeepFloyd IF 文本生成 语音生成 So-vits-svc 4.0 结尾...
-
AI打造“魔法博物馆”,五分钟完成一件“3D展品”
注意看,这是一家“魔法博物馆”,陈列的展品琳琅满目,甚至还有机甲套装…… 魔法镜子、水晶法杖……也是一应俱全,仿佛真的进入了魔法世界。 没错,这个“博物馆”里的“展品”全都是由AI打造的,而且一件只需要五分钟。 来自南洋理工大学、上海AI实验室等机构...
-
一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码
谷歌一出手,又把AI视频生成卷上了新高度。 一句话生成视频,现在在名为Lumiere的AI操刀下,可以是酱婶的: △“阳光明媚,帆船在湖中航行” 如此一致性和质量,再次点燃了网友们对AI视频生成的热情:谷歌加入战局,又有好戏可看了。 不止是文生视频,...
-
强化学习和世界模型中的因果推断
一、世界模型 “世界模型”源于认知科学,在认知科学里面有一个等价的词汇 mental models,也就是心智模型。那么什么是心智模型?在认知科学里有一个假设,认为人在大脑内部会有一个对于真实外在世界的表征,它对于认知这个世界,特别是推理和决策有很关...
-
AGI和AIGC傻傻分不清楚,一篇文章带你get
Look!👀我们的大模型商业化落地产品 📖更多AI资讯请👉🏾关注 Free三天集训营助教在线为您火热答疑👩🏼🏫 什么是 AGI(人工通用智能 ? AGI 是 Artificial General Intelligence 的缩写,中文翻译为“通...
-
拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型,首提时空架构,时长史诗级延长
爆肝7个月,谷歌祭出了AI视频大模型Lumiere,直接改变了游戏规则!全新架构让视频时长和一致性全面飞升,时长直接碾压Gen-2和Pika。 AI视频赛道上,谷歌又再次放出王炸级更新! 这个名为Google Lumiere的模型,是个大规模视频扩散模...
-
30岁以下的人都去哪儿了?OpenAI费尽心机吸引年轻人
编译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 比尔盖茨的博客栏目「与比尔·盖兹一起解惑」近日大火,OpenAI首席执行官奥特曼表示,OpenAI“不是由一群24岁的程序员运营的”,并表示这很令人担忧。 目前,许多热门的AI...
-
为什么大语言模型容易受到“蝴蝶效应”的影响
提示是我们让GenAI和大型语言模型与我们对话的方式,这本身就是一种艺术形式,因为我们试图让AI为我们提供‘准确’的答案。 但变种又如何呢?如果我们以某种方式构建提示,它会改变模型的决策(并影响其准确性 吗? 答案是:根据南加州大学信息科学研究所的研究...
-
OpenAI 董事会邀请竞争对手加入,挖角谷歌Gemini高管
据知情人士透露,OpenAI 董事会的 Adam D'Angelo 上个月致电 Databricks 的首席执行官 Ali Ghodsi,询问他是否考虑加入 OpenAI 董事会。这一举动引发了人们对 OpenAI 董事会动荡的担忧,尤其是对于 Altma...
-
研究: AI代替打工人成本太高,只有23% 视觉工作可替代
根据 MIT 计算机科学与人工智能实验室的研究,人工智能对打工人的淘汰速度可能比人们想象中的要慢得多。这是因为对于企业来说,视觉 AI 实在是太贵了。在绝大多数情况下,人力成本要比采用自动化更便宜。 图源备注:图片由AI生成,图片授权服务商Midjour...
-
全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步
过去一年,生成式人工智能发展的核心关键词,就是「大」。 人们逐渐接受了强化学习先驱 Rich Sutton 充分利用算力「大力出奇迹」的思潮,庞大的数据量是 AI 模型展现出惊人智慧的核心原因。数据规模越大、质量越高、标注越细,模型就能了解到更全面的世界...
-
如何应对AI增强的新型网络钓鱼攻击?
网络安全是一场持续不断的攻防竞赛,随着防御策略的不断改进,攻击者也在持续寻求增强攻击效果的新技术。研究人员发现,在目前广泛流行的网络钓鱼活动中,AI技术的采用和传播速度正在惊人发展,甚至会在不久的将来完全淘汰传统的人工网络钓鱼攻击。企业组织该如何面对这...
-
美国国家科学基金会与科技巨头合作,推动拜登重大AI科学计划
美国国家科学基金会(NSF)与其他10个政府机构携手人工智能开发商,共同推动总统拜登在人工智能领域的重大计划。这一合作计划的核心是推出国家人工智能研究资源(NAIRR 试点计划,旨在实现拜登总统的人工智能行政命令,通过向政府机构提供人工智能研究中心的访问,...
-
MIT新研究:打工人不用担心被AI淘汰!成本巨贵,视觉工作只有23%可替代
人工智能会抢走我们的工作吗?如果你每天都看硅谷高管谈论着当今尖端的AI技术,可能会觉得答案是肯定的,并且会很快发生。 不过,刚刚MIT计算机科学与人工智能实验室(CSAIL)最近的一项研究,可以让我们可以松一口气了:至少视觉AI还无法替代太多人类。 论...
-
AskDocs官网体验入口 AI文档处理工具软件app在线使用地址
AskDocs是您的AI助手,可以快速阅读、理解、查找和总结来自您的文档的信息。它可以处理多种文件类型,支持PDF、DOCX、TXT、CSV、EPUB和YouTube链接。用户可以选择不同的定价方案,根据需求选择适合自己的功能。通过AskDocs,用户可以...
-
拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型!首提时空架构,时长史诗级延长
AI视频赛道上,谷歌又再次放出王炸级更新! 这个名为Google Lumiere的模型,是个大规模视频扩散模型,彻底改变了AI视频的游戏规则。 跟其他模型不同,Lumiere凭借最先进的时空U-Net架构,在一次一致的通道中生成整个视频。 具体来说,现有...
-
「think step by step」还不够,让模型「think more steps」更有用
如今,大型语言模型(LLM)及其高级提示策略的出现,标志着对语言模型的研究取得了重大进展,尤其是在经典的 NLP 任务中。这其中一个关键的创新是思维链(CoT)提示技术,该技术因其在多步骤问题解决中的能力而闻名。这项技术遵循了人类的顺序推理,在各种挑战中...
-
首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024
目标跟踪是计算机视觉的一项基础视觉任务,由于计算机视觉的快速发展,单模态 (RGB 目标跟踪近年来取得了重大进展。考虑到单一成像传感器的局限性,我们需要引入多模态图像 (RGB、红外等 来弥补这一缺陷,以实现复杂环境下全天候目标跟踪。 然而,现有的多...
-
爆火《幻兽帕鲁》被指用AI缝合宝可梦,开发者自曝传奇经历:是人类的奇迹
4天卖出600万份,爆火游戏《幻兽帕鲁》最高180万人同时在线,直接登顶。 这个成绩,甚至在整个Steam游戏平台历史上也能排到第二,连平台自家王牌CS2都被挤下去了。 同时,玩家好评率也高达93%。 《幻兽帕鲁》为什么能叫好又叫座? 借鉴了“全球最赚...
-
MIT和谷歌提出新AI框架Health-LLM:利用可穿戴传感器数据为健康预测任务调整LLM
近日,MIT和Google的研究人员共同提出了一种名为Health-LLM的新型人工智能框架,旨在将大语言模型(LLMs)应用于健康预测任务,利用可穿戴传感器的数据。该框架的提出标志着健康领域在可穿戴技术和人工智能的交叉点上取得了重大突破。 可穿戴传感器技...
-
或许到 2030 年,量子计算的 ChatGPT 时刻即将到来
到 2030 年,我们将拥有能够破解 RSA 加密的机器,但量子传感和其他有益的应用应该首先到来。 政府、学术界和私营企业的各界技术专家正在有条不紊地努力,确保世界数据免受即将到来的量子解密威胁。 虽然这可能是人工智能造成灭绝的最大技术威胁,但沿途可能...
-
华盛顿大学推高效大模型调优方法“代理调优”
华盛顿大学推出更高效的大模型调优方法“代理调优”,该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测,实现对模型的调优而无需接触模型的内部权重。 随着ChatGPT等生成式AI产品的发展,基础模型的参数不断增加,因此进行权重调优需要耗费大...
-
使用SPIN技术对LLM进行自我博弈微调训练
2024年是大型语言模型(llm 的快速发展的一年,对于大语言模型的训练一个重要的方法是对齐方法,它包括使用人类样本的监督微调(SFT 和依赖人类偏好的人类反馈强化学习(RLHF 。这些方法在llm中发挥了至关重要的作用,但是对齐方法对人工注释数据有的大...
-
MIT研究:AI尚不会取代你的工作,因为它还是太昂贵了
随着人工智能技术的飞速发展,人们对工作安全性的担忧也逐渐升温。然而,麻省理工学院(MIT)的一项新研究表明,目前部署这项技术的成本可能使得雇主更倾向于保留现有员工,至少在当前情况下是这样。 通常人们考虑到AI替代工作时,更多关注技术在执行人类任务方面的表现...
-
业内:过去数月老款AI芯片降价,大模型培训成本降60%
1月24日消息,众所周知,开发大语言模型(LLM)成本高昂。这不仅包括模型本身的研发,还有在云端运行这些模型的费用。以人工智能初创公司Anthropic为例,云端运行模型的成本几乎占了该公司上个月收入的一半以上,这还未算上训练模型的成本。 然而,最近的...
-
AIWrite:智能写作工具全面解析
【产...
-
stable diffusion模型训练时数据量
文生图模型之Stable Diffusion - 知乎通向AGI之路码字真心不易,求点赞! https://zhuanlan.zhihu.com/p/6424968622022年可谓是 AIGC(AI Generated Content)元年,上半年有文生...
-
2024 年值得关注的 6 大生成式 AI 趋势
2023年是人工智能领域长期以来最具颠覆性的一年,大量生成式人工智能产品进入主流。继续其变革之旅,生成式人工智能有望在2024年从兴奋的话题转变为现实世界的应用。 随着科技公司不断开发和微调人工智能模型,生成式人工智能领域正在迅速发展,催生了一系列广泛的趋...
-
[论文精读] 自条件图像生成 - 【恺明大神新作,AIGC 新基准】
论文导读: 论文背景: 2023年8月,AI大神何恺明在个人网站宣布,2024年将加入MIT担任教职,回归学术界。这篇论文是其官宣加盟MIT后首度与MIT师生合著的公开论文,论文一作本科毕业于清华姚班,二作为MIT电气工程与计算机科学系教授,今年的斯...
-
你对AI未来的数据战略是什么?
随着企业变得更加数据驱动,古老的计算谚语垃圾输入,垃圾输出(GIGO 从未像现在这样正确。将AI应用于许多业务流程只会加速确保所用数据的准确性和及时性的需要,无论是内部生成的数据还是外部来源的数据。不良数据的代价 Gartner估计,企业因使用质量不佳...
-
消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型
大模型的「幻觉」问题马上要有解了? 威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统,可以让大模型对自己的输出给出评分。 如果用户看到模型的生成的结果评分不高,就能意识到这个回复可能是幻觉。 如果系统可以进一步筛选评分的结果进行输...
-
OpenAI 竞争对手 Cohere 正在洽谈融资 10 亿美元
据英国《金融时报》报道,OpenAI 的竞争对手 Cohere 正在洽谈筹集最多10亿美元的资金。 随着人工智能竞赛的升温,这将是这家加拿大初创公司有史以来获得的最大一笔资金。Cohere 迄今为止已完成四次融资,最后一次融资是在2023年6月,这家初创公...
-
可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE
IT之家 1 月 23 日消息,谷歌日前发布新闻稿,介绍了一款专为大语言模型设计的 ASPIRE 训练框架,该框架号称可以增强 AI 模型的选择性预测能力。 谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要...
-
UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官
近日,UCLA等机构的研究人员推出了具身智能大模型MultiPLY,该模型不仅具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。 MultiPLY在多任务实验中表...
-
Whisper Speech官网体验入口 开源AI语音合成工具免费使用地址
Whisper Speech是一款完全开源的文本转语音模型,由Collabora和Lion在Juwels超级计算机上训练。它支持多种语言和多种形式的输入,包括Node.js、Python、Elixir、HTTP、Cog和Docker。该模型的优势在于高效的...
-
视觉Mamba模型的Swin时刻,中国科学院、华为等推出VMamba
Transformer 在大模型领域的地位可谓是难以撼动。不过,这个AI 大模型的主流架构在模型规模的扩展和需要处理的序列变长后,局限性也愈发凸显了。Mamba的出现,正在强力改变着这一切。它优秀的性能立刻引爆了AI圈。 上周四, Vision Mamb...
-
即将到来的政府监管下的人工智能时代
斯蒂芬·霍金曾说过一句名言:“成功创造出有效的人工智能可能是我们文明史上最大的事件,但除非我们学会如何准备和避免潜在的风险,否则人工智能可能是我们文明史上最糟糕的事件。” 人工智能以LLM(大型语言模型 的形式出现爆炸式增长。基于与ChatGPT等工具...
-
人工智能如何重塑五大制造业?让AI项目顺利部署的五个步骤
如今,数字化转型已成为企业生存的基石。从自动化工厂到人工智能(AI)质量控制,数字化转型的主要目标是通过技术打造竞争优势,从而增强客户体验并降低运营成本。 制造业利用大数据分析、AI和机器人等技术,走在了数字化转型的前沿。据麦肯锡的相关调查显示,数字化...
-
Agent触摸汉堡辨冷热,首次拥有类人感官!UCLA等发布3D多模态交互具身智能大模型
具身智能,是大模型未来应用的一个重要方向。 现在,大模型加持下的智能体,能够参与3D环境,不仅有了听觉视觉,还有了触觉等多种感官能力。 卧室里有什么物体,一眼辨认。 听到门铃响了,LLM便会告诉你家里来客人了。 大模型加持的NPC,在触摸桌子的香蕉后,...
-
“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊
AGI若到来,人类是否会受到威胁,是一个大众热衷讨论同时研究者们也很关注的问题,从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。 1月9号他们发布了一篇论文,提出关于“Sleeper Agen...
-
AI的崛起:2024年人工智能技术趋势
在不断发展的技术领域,有一种现象一直吸引着我们的想象力,并重新定义了我们生活、工作和互动的方式:人工智能(AI 。随着我们步入2024年,人工智能将站在塑造我们未来的最重要技术趋势的最前沿。这项突破性的技术不仅改变了我们对创新的看法,而且已经成为我们日...
-
化学家和机器人都可以读懂,用于机器人合成可重复性的通用化学编程语言
有关化学合成的文献数量快速增长;然而,实验室之间共享和评估新流程需要很长时间。 在此,来自加拿大不列颠哥伦比亚大学(UBC)和英国格拉斯哥大学的研究团队,提出了一种方法,使用通用化学编程语言(χDL)在两个实验室的四种不同硬件系统上编码和执行各种化学反应...
-
Llama 2打败GPT-4!Meta让大模型自我奖励自迭代,再证合成数据是LLM终局
Llama 2-70B一夜之间打败GPT-4,让整个AI社区为之震惊! 甚至,在AlpacaEval 2.0排行榜中,微调后的模型胜率完全碾压Claude 2、Gemini Pro等模型。 Meta和NYU研究团队究竟提出了什么秘制配方,才能让Llam...
-
AIGC时代,分享11款超实用AI生成内容检测工具
前往未来百科查看全部AI内容检测工具箱 一、AI 内容检测器 在数字内容创作的世界中,高质量的内容对至关重要。但随着创建的内容量不断增加,确保内容是原创的、高质量的非常具有挑战性。 AI 内容检测器指的是一种利用人工智能技术来自动化审核和识别不...
-
世界首款电驱机器人练「空翻」,单挑波士顿动力Atlas!还会煮咖啡拉花
2017年,波士顿动力人形机器人Atlas会空翻那一幕,惊艳了全世界。 图片 而今天,挑战波士顿动力Atlas的全新人形机器人诞生了! 虽然还未装上上半身,仅有两足的机器人一个翻转后,稳稳地立在那里,不输Atlas。 值得一提的是,这是初创公司Magi...
-
AIGC的底层核心结构Transformer是如何彻底改变NLP游戏规则的?OJAC近屿智能带你一探究竟
Look!👀我们的大模型商业化落地产品 📖更多AI资讯请👉🏾关注 Free三天集训营助教在线为您火热答疑👩🏼🏫 没有Transformer,就没有NLP的突破,听起来有些夸张,但事实确实如此。什么是Transformer?Transforme...
-
GPT-4V惨败!CV大神谢赛宁新作:V*重磅「视觉搜索」算法让LLM理解力逼近人类
Sam Altman最近在世界经济论坛上发言,称达到人类级别的AI很快就会降临。 但是,正如LeCun一直以来所言,如今的AI连猫狗都不如。现在看来的确如此。 GPT-4V、LLaVA等多模态模型图像理解力足以让人惊叹。但是,它们并非真的能够做的面面俱到。...
-
Bard!谷歌对 ChatGPT 的最强反击,悄咪咪的支持中文了!
“ ChatGPT、Bard,哪个是更好的AI人工智能大语言模型。” 01 — ChatGPT 这么火,而且这款产品是 OpenAI 以谷歌的大模型架构 transformer 为基础迭代的。谷歌自然不甘落后,早在3月份推出自家的人...
-
LLaMA模型泄露 Meta成最大受益者
一份被意外泄露的谷歌内部文件,将Meta的LLaMA大模型“非故意开源”事件再次推到大众面前。“泄密文件”的作者据悉是谷歌内部的一位研究员,他大胆指出,开源力量正在填平OpenAI与谷歌等大模型巨头们数年来筑起的护城河,而最大的受益者是Meta,因为该公司...