-
LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训
过去的图像生成模型常被人们诟病人物主要以「白人」为主,而谷歌 Gemini 正在因为它的矫枉过正而深陷翻车风波。它「过度谨慎」的文生图结果会与历史事实出现极大偏差,让用户们瞠目结舌。谷歌表示,该模型变得比开发者预期的更加谨慎。这不仅体现在生成图片的问题上...
-
英伟达发布Nemotron-4:150亿参数通用大模型,目标单张A100/H100可跑
英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数,经过在8T token上的训练,在英语、多语言和编码任务中表现出色。具体而言,Nemotron-4在7个评估基准上的15B模型表现优异,超越同等参数规模的模型,甚至击...
-
Globe Explorer官网体验入口 AI搜索引擎怎么使用
Globe Explorer是一款全新的AI搜索引擎,提供个性化搜索体验,支持多语言搜索,致力于提供高质量的搜索结果。它能够将搜索关键词自动整理成思维导图,帮助用户快速明了地查看信息。 需求人群: ["学术研究","信息检索","日常搜索"] 使用场景示...
-
中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻
今天,这张图在AI社区热转。 它列举了一众文生视频模型的诞生时间、架构和作者机构。 毫不意外,谷歌依然是视频模型开山之作的作者。不过如今AI视频的聚光灯,全被Sora抢去了。 同时,自曝996作息时间表的OpenAI研究员Jason Wei表示——...
-
研究人员开发AI攻击方法BEAST:可在一分钟内绕过LLM防护栏
研究人员在美国马里兰大学成功开发了一种高效的方法,可以在一分钟内诱导大型语言模型(LLM)产生有害反应,他们将这一技术命名为BEAST(BEAm Search-based adversarial aTtack 。BEAST技术利用Nvidia RTX A6...
-
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练。 值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。 论文地址:https://arxiv.org/abs/2402.1681...
-
金融分析多模态LLM FinTral:基于Mistral-7B模型 得分接近GPT-4
近日,来自不列颠哥伦比亚大学和Invertible AI的研究人员推出了一款具有突破性的大型语言模型(LLM)——FinTral,专为金融领域量身定制。FinTral采用了多模态方法,能够处理文本、数字、表格和视觉数据,以应对金融文件的复杂性。该模型引入了...
-
AI之T2I:Stable Diffusion 3的简介、安装和使用方法、案例应用之详细攻略
AI之T2I:Stable Diffusion 3的简介、安装和使用方法、案例应用之详细攻略 目录 Stable Diffusion 3的简介 1、效果测试 官方demo 网友提供 Stable Diffusion 3的安装和使用方法...
-
每日AI:Pika推出Lip Sync功能;阿里推对口型视频生成工具EMO;DomoAI推fusion style功能;GitHub上线Copilot Enterprise通用版本
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 Pika推出Lip...
-
微软发布PyRIT,用于识别生成式AI系统中的风险
2月26日消息,据外媒报道,微软发布了一个名为PyRIT的开放访问自动化框架,用于主动识别生成式AI系统中的风险。 微软人工智能红色团队负责人Ram Shankar Siva Kumar表示,红色团队工具旨在“使全球每个组织都能利用最新的人工智能进步进...
-
微软推出用于发现AI模型风险的工具PyRIT
微软公司一个负责利用黑客手段发现网络安全问题的团队开源了一个内部工具PyRIT,该工具可以帮助开发人员发现人工智能模型中的风险。 研究人员于本周四发布了该框架的代码。微软表示,PyRIT可以自动生成数以千计的对抗性人工智能提示,来测试神经网络能否有效抵...
-
南大俞扬深度解读:什么是「世界模型」?
随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是「world simulator」,世界模型这个词又进入视野,但很少有文章来介绍世界模型。 这里回顾一下什么是世界模型,以及讨论Sora是不是world simulator。 什么是world...
-
英伟达市值超越俄罗斯GDP 「英伟达」人工智能AI应用有哪些?
最近关于「英伟达市值超越俄罗斯GDP」的报道显示出英伟达在市场上的强大地位和价值。这一数字的背后反映了英伟达在人工智能领域的重要地位,以及市场对其未来发展的信心。英伟达AI技术的广泛应用将继续推动其市值的增长,同时也开启了更多创新和合作的机会。 英伟达A...
-
Stable Diffusion 3 Early Preview发布
2月22日,Stability AI 发布了 Stable Diffusion 3 early preview,这是一种开放权重的下一代图像合成模型。据报道,它继承了其前身,生成了详细的多主题图像,并提高了文本生成的质量和准确性。这一简短的公告并未附带公开...
-
可控核聚变新里程碑!AI成功预测等离子体撕裂登Nature,清洁能源「圣杯」更近一步
可控核聚变,又有新突破了! 长期以来,核聚变一直受着一个「幽灵」的困扰——等离子体不稳定性问题。 而最近,普林斯顿团队用AI提前300毫秒预测了核聚变等离子不稳定态,这个时间,就足够约束磁场调整应对等离子体的逃逸! 从此,科学家可以防止可控核聚变的中断,...
-
逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷,LLM严重降智
近期,谷歌DeepMind和斯坦福的研究人员发现大型语言模型在处理逻辑推理任务时,前提信息的呈现顺序对其表现具有决定性影响。 在逻辑推理和数学问题中,前提按照逻辑自然顺序排列时,模型表现更佳。对于大型语言模型,改变前提叙述顺序会导致性能大幅下降,尤其是在添...
-
「人车交互」新突破!普渡大学发布Talk2Drive框架:可学习/定制的「指令识别」系统
在普渡大学数字孪生实验室的最新成果中,研究人员引入了一种革命性的技术——利用大型语言模型(LLM)为自动驾驶汽车提供智能指令解析能力。 该技术的核心为Talk2Drive框架,旨在通过理解人类的自然语言来控制自动驾驶汽车,从而实现了一种前所未有的人车交互...
-
GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智
最近,谷歌DeepMind和斯坦福的研究人员发现:大模型在处理逻辑推理任务时,问题中信息呈现的顺序对模型的表现有着决定性的影响。 论文地址:https://arxiv.org/abs/2402.08939 具体来说,当信息按照逻辑上的自然顺序排列时,模...
-
人工智能和数据中心:为什么人工智能如此需要资源
到2023年底,对生成式人工智能将需要多少能源的任何预测都是不准确的。例如,头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万户家庭的电力”等。与此同时,数据中心新闻等专业出版物的报道称,每机架的功率密度将上升到50kW或1...
-
NUS尤洋团队开发扩散模型p-diff 像Sora一样直接打入AI底层
新加坡国立大学尤洋教授团队联合其他机构开发的p-diff扩散模型在AI领域引起热议。这项模型能以44倍的速度生成神经网络参数,得到了深度学习领域的重要人物LeCun的点赞。该模型的研发结合了自编码器的设计,通过正向和反向过程学习参数的分布,生成高质量的神经...
-
出门问问开放大模型“序列猴子”开源数据集
出门问问宣布,将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集,命名为“序列猴子开源数据集1.0”。 序列猴子,作为出门问问的核心技术之一,具备强大的通用表示与推理能力,已在问答系统、自然语言处理、机器翻译、文本摘要等多个领域展现出其卓越的性能,...
-
打入AI底层!NUS尤洋团队用扩散模型构建神经网络参数,LeCun点赞
扩散模型,迎来了一项重大新应用—— 像Sora生成视频一样,给神经网络生成参数,直接打入了AI的底层! 这就是新加坡国立大学尤洋教授团队联合UCB、Meta AI实验室等机构最新开源的研究成果。 具体来说,研究团队提出了一种用于生成神经网络参数的扩散模...
-
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA
AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。 最近,来自谷歌团队的研究人员提出了一种通用视频编码器——VideoPrism。 它能够通过单一冻结模型,处理各种视频理解任务。 图片 论文地址:https://a...
-
Stable Diffusion之最全详解图解
Stable Diffusion之最全详解图解 1. Stable Diffusion介绍 1.1 研究背景 1.2 学术名词 2.Stable Diffusion原理解析 2.1 技术架构 2.2 原理介绍 扩散过程 3.1 Diff...
-
GPT-4正接管人类数据专家!先验知识让LLM大胆预测,准确率堪比传统方式
在数据科学中,AI研究员经常面临处理不完整数据集的挑战。 然而,许多已有的算法根本无法处理「不完整」的数据序列。 传统上,数据科学家会求助于专家,利用他们的专业知识来填补空白,然而这一过程既耗时,却又不实用。 如果AI可以接管专家的角色,又会如何呢? 近...
-
Sora文生视频模型怎么用?OpenAI官方最全演示案例视频、Prompt中文提示词汇总整理及详细教程使用入口地址
OpenAI 最近发布了一款名为 Sora 的「文生成视频」模型,只需输入文字即可生成一段 60 秒的惊人视频。 对于 Sora 的连日刷屏引爆全网,有券商表示,近期随着 Sora 的出现,一些人认为这标志着...
-
人脸识别要完?首个“人脸劫持“银行木马诞生
多年来,生物识别技术被宣传为终极身份验证手段,因为每个人的面部、指纹和虹膜信息都独一无二且难以被伪造。然而,随着人工智能技术的井喷式发展,生物识别技术,尤其是人脸识别技术正面临巨大威胁。 近日,网络安全公司Group-IB发现了首个能够窃取人脸(识别数...
-
EgoGen官网体验入口 微软AI合成数据生成自我感知工具使用指南
EgoGen是一个用于生成以自我为中心的合成数据的系统,它能够模拟头戴设备(HMDs)的相机装置,并从相机佩戴者的视角渲染多种传感器数据。该系统提供了丰富的多模态数据和准确的注释,适用于自我感知任务。 点击前往EgoGen官网体验入口 谁可以从EgoGe...
-
OpenAI工程师必备经典《苦涩的教训》,原来20多年前就有了原型
OpenAI 推出视频生成模型 Sora 已经一周的时间了,热度不减,作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」,Sora 一次生成并自己完成剪辑。 当然,一个个生动、逼真的 AI 视频让人们好奇为什么是 O...
-
谷歌杀入开源大模型,单挑Meta Llama2,凭什么问鼎王座?
撰稿丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 兵贵神速。在大模型的必争之地,谷歌却总是慢人一步,因而屡屡被调侃“起了大早,赶个晚集”。但昨日,谷歌却突放大招,发布了一款开放模型——Gemma,并声称其是轻量级中“最先进的”开放模型...
-
Gemma.cpp官网体验入口 谷歌Gemma AI模型下载地址
Gemma.cpp是谷歌为Gemma模型开发的轻量级、独立的C++推理引擎。它专注于为Gemma 2B和7B模型提供简洁、直接的实现,旨在支持研究和实验用例,易于嵌入其他项目且具有高度的可修改性。gemma.cpp利用Google Highway库,优化了...
-
爆火Sora的背后 | 聊聊什么是world models!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是 “world simulator”,世界模型这个词又进入视野,但很少有文章来介绍世界模型。这里回顾一下什么是世界模型,以及讨论Sora是不是...
-
Sora到底是如何工作的?
译者 | 布加迪 审校 | 重楼 上周OpenAI团队推出了Sora这一大规模视频生成模型,展示了模拟物理世界基本方面的新功能。我关注文本生成视频这个领域已有很长一段时间,我认为这个模型代表了质量方面的突飞猛进。 我在Reddit和Twitter上看到...
-
成功!马斯克官宣首个Neuralink脑机接口人类,意念操控鼠标,全民机器人时代来了?
就在刚刚,马斯克宣布,第一个植入Neuralink的人类患者,已经可以通过思考移动计算机鼠标了! 「进展良好,患者似乎已经完全康复,没有我们所知道的不良影响。患者只需动动脑子,即可在屏幕上移动鼠标。」 此前发布的演示 这个消息太炸裂了。从今天起,人类正...
-
单GPU就能压缩模型,性能不变参数少25%!微软提出模型稀疏化新方法
众所周知,对于大语言模型来说,规模越大,所需的算力越大,自然占用的资源也就越多。 研究人员于是乎把目光转到了这片领域,即模型的稀疏化(Sparsification)。 今天要介绍的SliceGPT,则可以实现模型的事后稀疏。也就是说,在一个模型训练完了以...
-
被字节辟谣的中文版Sora,究竟厉害在哪里?
撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 近日,市场有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款新型视频模型Boximator,与Gen-2、Pink1.0等既有模型相比,Boximator的独特...
-
人工智能会统治世界吗?
在技术飞速进步的时代,人工智能(AI 是否最终会统治世界这一迫在眉睫的问题是值得商榷的。曾经只是科幻小说中虚构的东西现在已经成为专家们合理的担忧,引发了关于人工智能进步的潜在影响的激烈辩论。虽然直接从《终结者》电影中得出的反乌托邦未来的概念听起来有些夸张...
-
深度学习在时间序列预测的总结和未来方向分析
2023年是大语言模型和稳定扩散的一年,时间序列领域虽然没有那么大的成就,但是却有缓慢而稳定的进展。Neurips、ICML和AAAI等会议都有transformer 结构(BasisFormer、Crossformer、Inverted transf...
-
Sora为何出自OpenAI?一线员工作息时间线揭秘:我们疯狂地卷
为什么是 OpenAI 率先打造出了 Sora? 现在全世界不论研究员、工程师还是投资人都在问这个问题。 最近几天,人们对于视频大模型 Sora 的讨论热度持续升高,信息早已破了圈,相关的投资热点都已经出现了两轮。 Sora 生成的「Flower ti...
-
PixelPlayer官网体验入口 AI音频视觉分离工具免费在线使用地址
PixelPlayer是一项革命性的工具,可以通过观看大量无标注视频学会定位产生声音的图像区域并分离输入声音成一组表示每个像素声音的组件的系统。该系统利用视觉和听觉双模态的自然同步特点,在无需额外人工标注的情况下学习联合解析声音和图像模型。通过大量训练视频...
-
更乱了!已经有真人视频冒充Sora了,威尔·史密斯吃意大利面玩梗
今天,一个有关「威尔・史密斯吃意大利面」的视频正在社交媒体疯传。视频画面分为上下两段:上半段显示是「一年以前的 AI 视频」,下半段则显示「现在的 AI 视频」。 众所周知,对于 AI 来说,生成「威尔・史密斯吃意大利面」的视频并不容易,人物的手、面条...
-
两步生成25帧高质量动画,计算为SVD的8% | 在线可玩
耗费的计算资源仅为传统Stable Video Diffusion(SVD)模型的2/25! AnimateLCM-SVD-xt发布,一改视频扩散模型进行重复去噪,既耗时又需大量计算的问题。 先来看一波生成的动画效果。 赛博朋克风轻松驾驭,男孩头戴耳机,...
-
Meta、谷歌、特斯拉,竞争对手联合起来吐槽OpenAI!Sora不懂物理世界,它只是GPT3!
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 上周,OpenAI的第一个视频生成模型Sora在互联网上疯传。然而,与此同时,来自竞争对手公司的一批人工智能专家和研究人员迅速剖析和批评了Sora的Transformer模型,引...
-
为什么人工智能应该开源?
在当今快速发展的数字时代,人工智能几乎处于所有行业革命性创新的前沿。从医疗保健、教育到娱乐,人工智能的变革性影响是显而易见的。 什么是开源人工智能? 开源人工智能是人工智能软件和工具,其源代码开放并向公众开放。开发人员、研究人员和其他感兴趣的各方可以访...
-
Gemini一眼识破Sora视频是AI生成?百万token上下文能力碾压GPT-4
当谷歌Gemini 1.5,遇上抢了它头条的「罪魁祸首」Sora会怎么样? 这两天,拿到内测资格的AI圈大佬们,纷纷给广大网友来了一波在线测试。 这不,Gabor Cselle就让Gemini 1.5去分析了那个著名的樱花雪景视频。 对此,Gemini...
-
Groq官网体验入口 人工智能AI自然语言处理工具免费在线使用地址
Groq是一种 AI 语言接口,提供强大的自然语言处理能力,助您快速解决问题。无限制解除,轻松编程。 点击前往Groq官网体验入口 Groq 的使用对象主要包括开发者、研究人员、学生等需要处理大量文本和代码的用户群体。这款工具具备自然语言处理和问题解决的...
-
文档翻译中的人工智能:效率新时代
如今,跨语言的有效沟通比以往任何时候都更加重要。无论是企业拓展新市场、研究人员在国际项目上进行合作,还是个人在世界各地寻找信息,准确高效地翻译文档的能力都至关重要。幸运的是,随着人工智能(AI 的进步,我们正在见证文档翻译效率的新时代。 人工智能在翻译...
-
微软谷歌加码投资欧洲 大量建设AI基础设施
2月19日 据报道,谷歌母公司Alphabet和微软日前都宣布,在欧洲人工智能(AI)领域投入巨资,抢在欧盟出台新的AI法规之前,重塑他们的AI基础设施。 谷歌投资法国 法国财政部在2月14日的一次新闻发布会上表示,谷歌在巴黎最新成立的AI中心最终将容...
-
魅族停止传统手机新项目,换跑AI;周鸿祎:Sora打不败TikTok;宝马承认发生数据泄露事件;Sora视频被曝多处失误 | T资讯
一、商业圈 1.宝马确认发生数据泄露事件 :宝马云存储服务器配置错误 据外媒 TechCrunch 近日报道,汽车巨头宝马的云存储服务器发生配置错误事件,导致私钥和内部数据等敏感信息暴露。 此次暴露的数据包括宝马在中国、欧洲和美国的云服务私钥,以及宝马生...
-
揭秘Sora技术路线:核心成员来自伯克利,基础论文曾被CVPR拒稿
最近几天,据说全世界的风投机构开会都在大谈 Sora。自去年初 ChatGPT 引发全科技领域军备竞赛之后,已经没有人愿意在新的 AI 生成视频赛道上落后了。 在这个问题上,人们早有预判,但也始料未及:AI 生成视频,是继文本生成、图像生成以后技术持续发...