-
首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024
目标跟踪是计算机视觉的一项基础视觉任务,由于计算机视觉的快速发展,单模态 (RGB 目标跟踪近年来取得了重大进展。考虑到单一成像传感器的局限性,我们需要引入多模态图像 (RGB、红外等 来弥补这一缺陷,以实现复杂环境下全天候目标跟踪。 然而,现有的多...
-
爆火《幻兽帕鲁》被指用AI缝合宝可梦,开发者自曝传奇经历:是人类的奇迹
4天卖出600万份,爆火游戏《幻兽帕鲁》最高180万人同时在线,直接登顶。 这个成绩,甚至在整个Steam游戏平台历史上也能排到第二,连平台自家王牌CS2都被挤下去了。 同时,玩家好评率也高达93%。 《幻兽帕鲁》为什么能叫好又叫座? 借鉴了“全球最赚...
-
MIT和谷歌提出新AI框架Health-LLM:利用可穿戴传感器数据为健康预测任务调整LLM
近日,MIT和Google的研究人员共同提出了一种名为Health-LLM的新型人工智能框架,旨在将大语言模型(LLMs)应用于健康预测任务,利用可穿戴传感器的数据。该框架的提出标志着健康领域在可穿戴技术和人工智能的交叉点上取得了重大突破。 可穿戴传感器技...
-
或许到 2030 年,量子计算的 ChatGPT 时刻即将到来
到 2030 年,我们将拥有能够破解 RSA 加密的机器,但量子传感和其他有益的应用应该首先到来。 政府、学术界和私营企业的各界技术专家正在有条不紊地努力,确保世界数据免受即将到来的量子解密威胁。 虽然这可能是人工智能造成灭绝的最大技术威胁,但沿途可能...
-
华盛顿大学推高效大模型调优方法“代理调优”
华盛顿大学推出更高效的大模型调优方法“代理调优”,该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测,实现对模型的调优而无需接触模型的内部权重。 随着ChatGPT等生成式AI产品的发展,基础模型的参数不断增加,因此进行权重调优需要耗费大...
-
使用SPIN技术对LLM进行自我博弈微调训练
2024年是大型语言模型(llm 的快速发展的一年,对于大语言模型的训练一个重要的方法是对齐方法,它包括使用人类样本的监督微调(SFT 和依赖人类偏好的人类反馈强化学习(RLHF 。这些方法在llm中发挥了至关重要的作用,但是对齐方法对人工注释数据有的大...
-
MIT研究:AI尚不会取代你的工作,因为它还是太昂贵了
随着人工智能技术的飞速发展,人们对工作安全性的担忧也逐渐升温。然而,麻省理工学院(MIT)的一项新研究表明,目前部署这项技术的成本可能使得雇主更倾向于保留现有员工,至少在当前情况下是这样。 通常人们考虑到AI替代工作时,更多关注技术在执行人类任务方面的表现...
-
业内:过去数月老款AI芯片降价,大模型培训成本降60%
1月24日消息,众所周知,开发大语言模型(LLM)成本高昂。这不仅包括模型本身的研发,还有在云端运行这些模型的费用。以人工智能初创公司Anthropic为例,云端运行模型的成本几乎占了该公司上个月收入的一半以上,这还未算上训练模型的成本。 然而,最近的...
-
AIWrite:智能写作工具全面解析
【产...
-
stable diffusion模型训练时数据量
文生图模型之Stable Diffusion - 知乎通向AGI之路码字真心不易,求点赞! https://zhuanlan.zhihu.com/p/6424968622022年可谓是 AIGC(AI Generated Content)元年,上半年有文生...
-
2024 年值得关注的 6 大生成式 AI 趋势
2023年是人工智能领域长期以来最具颠覆性的一年,大量生成式人工智能产品进入主流。继续其变革之旅,生成式人工智能有望在2024年从兴奋的话题转变为现实世界的应用。 随着科技公司不断开发和微调人工智能模型,生成式人工智能领域正在迅速发展,催生了一系列广泛的趋...
-
[论文精读] 自条件图像生成 - 【恺明大神新作,AIGC 新基准】
论文导读: 论文背景: 2023年8月,AI大神何恺明在个人网站宣布,2024年将加入MIT担任教职,回归学术界。这篇论文是其官宣加盟MIT后首度与MIT师生合著的公开论文,论文一作本科毕业于清华姚班,二作为MIT电气工程与计算机科学系教授,今年的斯...
-
你对AI未来的数据战略是什么?
随着企业变得更加数据驱动,古老的计算谚语垃圾输入,垃圾输出(GIGO 从未像现在这样正确。将AI应用于许多业务流程只会加速确保所用数据的准确性和及时性的需要,无论是内部生成的数据还是外部来源的数据。不良数据的代价 Gartner估计,企业因使用质量不佳...
-
消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型
大模型的「幻觉」问题马上要有解了? 威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统,可以让大模型对自己的输出给出评分。 如果用户看到模型的生成的结果评分不高,就能意识到这个回复可能是幻觉。 如果系统可以进一步筛选评分的结果进行输...
-
OpenAI 竞争对手 Cohere 正在洽谈融资 10 亿美元
据英国《金融时报》报道,OpenAI 的竞争对手 Cohere 正在洽谈筹集最多10亿美元的资金。 随着人工智能竞赛的升温,这将是这家加拿大初创公司有史以来获得的最大一笔资金。Cohere 迄今为止已完成四次融资,最后一次融资是在2023年6月,这家初创公...
-
可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE
IT之家 1 月 23 日消息,谷歌日前发布新闻稿,介绍了一款专为大语言模型设计的 ASPIRE 训练框架,该框架号称可以增强 AI 模型的选择性预测能力。 谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要...
-
UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官
近日,UCLA等机构的研究人员推出了具身智能大模型MultiPLY,该模型不仅具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。 MultiPLY在多任务实验中表...
-
Whisper Speech官网体验入口 开源AI语音合成工具免费使用地址
Whisper Speech是一款完全开源的文本转语音模型,由Collabora和Lion在Juwels超级计算机上训练。它支持多种语言和多种形式的输入,包括Node.js、Python、Elixir、HTTP、Cog和Docker。该模型的优势在于高效的...
-
视觉Mamba模型的Swin时刻,中国科学院、华为等推出VMamba
Transformer 在大模型领域的地位可谓是难以撼动。不过,这个AI 大模型的主流架构在模型规模的扩展和需要处理的序列变长后,局限性也愈发凸显了。Mamba的出现,正在强力改变着这一切。它优秀的性能立刻引爆了AI圈。 上周四, Vision Mamb...
-
即将到来的政府监管下的人工智能时代
斯蒂芬·霍金曾说过一句名言:“成功创造出有效的人工智能可能是我们文明史上最大的事件,但除非我们学会如何准备和避免潜在的风险,否则人工智能可能是我们文明史上最糟糕的事件。” 人工智能以LLM(大型语言模型 的形式出现爆炸式增长。基于与ChatGPT等工具...
-
人工智能如何重塑五大制造业?让AI项目顺利部署的五个步骤
如今,数字化转型已成为企业生存的基石。从自动化工厂到人工智能(AI)质量控制,数字化转型的主要目标是通过技术打造竞争优势,从而增强客户体验并降低运营成本。 制造业利用大数据分析、AI和机器人等技术,走在了数字化转型的前沿。据麦肯锡的相关调查显示,数字化...
-
Agent触摸汉堡辨冷热,首次拥有类人感官!UCLA等发布3D多模态交互具身智能大模型
具身智能,是大模型未来应用的一个重要方向。 现在,大模型加持下的智能体,能够参与3D环境,不仅有了听觉视觉,还有了触觉等多种感官能力。 卧室里有什么物体,一眼辨认。 听到门铃响了,LLM便会告诉你家里来客人了。 大模型加持的NPC,在触摸桌子的香蕉后,...
-
“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊
AGI若到来,人类是否会受到威胁,是一个大众热衷讨论同时研究者们也很关注的问题,从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。 1月9号他们发布了一篇论文,提出关于“Sleeper Agen...
-
AI的崛起:2024年人工智能技术趋势
在不断发展的技术领域,有一种现象一直吸引着我们的想象力,并重新定义了我们生活、工作和互动的方式:人工智能(AI 。随着我们步入2024年,人工智能将站在塑造我们未来的最重要技术趋势的最前沿。这项突破性的技术不仅改变了我们对创新的看法,而且已经成为我们日...
-
化学家和机器人都可以读懂,用于机器人合成可重复性的通用化学编程语言
有关化学合成的文献数量快速增长;然而,实验室之间共享和评估新流程需要很长时间。 在此,来自加拿大不列颠哥伦比亚大学(UBC)和英国格拉斯哥大学的研究团队,提出了一种方法,使用通用化学编程语言(χDL)在两个实验室的四种不同硬件系统上编码和执行各种化学反应...
-
Llama 2打败GPT-4!Meta让大模型自我奖励自迭代,再证合成数据是LLM终局
Llama 2-70B一夜之间打败GPT-4,让整个AI社区为之震惊! 甚至,在AlpacaEval 2.0排行榜中,微调后的模型胜率完全碾压Claude 2、Gemini Pro等模型。 Meta和NYU研究团队究竟提出了什么秘制配方,才能让Llam...
-
AIGC时代,分享11款超实用AI生成内容检测工具
前往未来百科查看全部AI内容检测工具箱 一、AI 内容检测器 在数字内容创作的世界中,高质量的内容对至关重要。但随着创建的内容量不断增加,确保内容是原创的、高质量的非常具有挑战性。 AI 内容检测器指的是一种利用人工智能技术来自动化审核和识别不...
-
世界首款电驱机器人练「空翻」,单挑波士顿动力Atlas!还会煮咖啡拉花
2017年,波士顿动力人形机器人Atlas会空翻那一幕,惊艳了全世界。 图片 而今天,挑战波士顿动力Atlas的全新人形机器人诞生了! 虽然还未装上上半身,仅有两足的机器人一个翻转后,稳稳地立在那里,不输Atlas。 值得一提的是,这是初创公司Magi...
-
AIGC的底层核心结构Transformer是如何彻底改变NLP游戏规则的?OJAC近屿智能带你一探究竟
Look!?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??? 没有Transformer,就没有NLP的突破,听起来有些夸张,但事实确实如此。什么是Transformer?Transforme...
-
GPT-4V惨败!CV大神谢赛宁新作:V*重磅「视觉搜索」算法让LLM理解力逼近人类
Sam Altman最近在世界经济论坛上发言,称达到人类级别的AI很快就会降临。 但是,正如LeCun一直以来所言,如今的AI连猫狗都不如。现在看来的确如此。 GPT-4V、LLaVA等多模态模型图像理解力足以让人惊叹。但是,它们并非真的能够做的面面俱到。...
-
Bard!谷歌对 ChatGPT 的最强反击,悄咪咪的支持中文了!
“ ChatGPT、Bard,哪个是更好的AI人工智能大语言模型。” 01 — ChatGPT 这么火,而且这款产品是 OpenAI 以谷歌的大模型架构 transformer 为基础迭代的。谷歌自然不甘落后,早在3月份推出自家的人...
-
LLaMA模型泄露 Meta成最大受益者
一份被意外泄露的谷歌内部文件,将Meta的LLaMA大模型“非故意开源”事件再次推到大众面前。“泄密文件”的作者据悉是谷歌内部的一位研究员,他大胆指出,开源力量正在填平OpenAI与谷歌等大模型巨头们数年来筑起的护城河,而最大的受益者是Meta,因为该公司...
-
新AI框架 AboutMe:用网页中自我描述来记录英语预训练数据过滤器的效果
随着自然语言处理和自然语言生成的进步,大型语言模型(LLMs)在实际应用中得到了广泛使用。由于它们能够模仿人类行为,并具有通用性,这些模型已经涉足各个领域。 虽然这些模型引起了相当大的关注,但它们代表了一组受限和偏向的人类观点和知识。预训练数据的组成是造成...
-
劈柴曝谷歌2024年全年裁员,牵出华人员工自杀事件!硅谷近8000人疑被AI淘汰
硅谷一年一度的开年裁员大礼包,又来了。 目前,谷歌的裁员动荡,还在继续。就在今天,CEO劈柴又发出了全员公开信,表示裁员将持续2024一整年! 1月10号以来,谷歌已经有多部门的近1000名员工被裁。谷歌硬件、广告销售、搜索、购物、地图、政策、核心工程...
-
智能车的「ChatGPT时刻」,还有多远?| 模力时代
要说今年“科技春晚”CES上最吸引眼球的是什么,智能车当属其一。 毕竟大模型一上车,智能座舱都卷成酱婶了: 让车上的数字助手帮忙记录约饭日程,Ta能直接帮你把餐厅也给预定了。 △骁龙座舱平台效果展示 规划路线这种事儿也变得充满巧思,数字助手会根据你的习...
-
最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发
Mixtral 8x7B开源模型的诞生,正如Llama一样,为开源社区了带来曙光。 前段时间,Mixtral刚刚发布了8x7B模型的论文。在基准测试结果中,其性能达到或超过 Llama 2-70B和GPT-3.5。 甚至,Mixtral在数学、代码生成和...
-
GPU库存将到60万个!扎克伯格确认新目标:创建通用人工智能
1月19日消息,在科技领域,一股热潮正席卷而来,它源于一种坚定的信念,即科技行业正迈向实现超人、神级智能的道路上。引领这股潮流的旗手包括OpenAI,他们宣称要创造出这种通用人工智能(AGI)。而谷歌人工智能项目负责人杰米斯·哈萨比斯(Demis Ha...
-
奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞
这一次,人工智能算法在数学奥林匹克竞赛(IMO)上取得了重大成绩突破。 在今天发表的国际权威期刊《自然》杂志最新一期上,论文《Solving olympiad geometry without human demonstrations》向世人介绍了 A...
-
OpenAI 公布2024选举虚假信息打击计划
据统计,2024 年预计将有 50 多个国家举行大选,虚假信息的威胁成为人们关注的焦点。 人工智能聊天机器人 ChatGPT 和图像生成器 DALL-E 的开发商 OpenAI 近日宣布了一项新的措施,以防止在今年大选之前再次出现虚假信息滥用和误导事件。...
-
RoSA: 一种新的大模型参数高效微调方法
随着语言模型不断扩展到前所未有的规模,对下游任务的所有参数进行微调变得非常昂贵,PEFT方法已成为自然语言处理领域的研究热点。PEFT方法将微调限制在一小部分参数中,以很小的计算成本实现自然语言理解任务的最先进性能。 (RoSA 是一种新的PEFT技术...
-
马毅LeCun谢赛宁曝出多模态LLM重大缺陷!开创性研究显著增强视觉理解能力
Sam Altman在各种场合都提到,大语言模型的多模态能力,是未来AI技术能够造福人类的最亟待突破的领域。 那么现在在多模态大模型的视觉功能能否达到与语言功能匹配的水平? 当前多模态模型取得的进步很大程度上归功于大语言模型(LLM)的推理能力。但在视...
-
几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型
在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体3D模型非常重要。 传统的方法创建这些模型不仅需要大量时间,还需要能够捕捉多视角照片的专业设备,此外还依赖于技术熟练的专业人员。 与此相反,在日常生活中,我们最常见...
-
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞
如何根据特定需求选择视觉模型? ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较? 来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。 论文地址:ht...
-
新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度
大语言模型序列长度的限制,极大地制约了其在人工智能领域的应用,比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加...
-
AIGC大模型必备知识——LLM ,你知道它是如何训练的吗?小白必读深度好文
Look!?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??? 近年来,人工智能(AI)领域经历了令人瞩目的增长,尤其是自然语言处理(NLP)。你知道是什么推动了NLP领域的这种飞速发展吗?没错,那...
-
谷歌推几何AI系统AlphaGeometry,实力达奥林匹克金牌得主
Google DeepMind 发布了一个名为AlphaGeometry 的人工智能系统,它可以解决复杂的几何问题,其水平接近人类奥林匹克金牌得主——这是人工智能性能的突破。在对30道奥数几何题的基准测试中,AlphaGeometry 在标准奥数时限内解决...
-
GLM-4体验入口 智谱AI多模态大模型在线使用地址
GLM-4是由智谱AI在首届技术开放日上发布的一款新型大模型。GLM- 4 在性能上全面提升近60%,支持更长的上下文、更强的多模态支持和更快速的推理。产品定位为下一代基座大模型,旨在为文本处理、数据分析、图像生成等领域提供高效的AI解决方案。 点击前往...
-
能做鬼脸、摇滚、自拍,听懂你说的话!GPT-4驱动的实体机器人
东京大学的研究人员将GPT-4模型,集成在实体机器人Alter3中,可将文本、语言直接转化成机器人动作,例如,做一个自拍动作;装一个“鬼样”;做一个摇滚音乐动作等,就连微笑、眨眼这样的面部表情动作也没问题。 在GPT-4的帮助下,Alter3建立了语言反馈...
-
一文读懂大型语言模型参数高效微调:Prefix Tuning与LLaMA-Adapter
芝士AI吃鱼 在快速发展的人工智能领域中,高效、有效地使用大型语言模型变得日益重要,参数高效微调是这一追求的前沿技术,它允许研究人员和实践者在最小化计算和资源占用的同时,重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...
-
AI视野:Stability AI发布代码模型Stable Code3B;书生·浦语2.0正式开源;阿里推新项目MotionShop;Win11新增AI生成图像功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ????大模型动态 Stabili...