研究人员第17页

人工智能和数据中心：为什么人工智能如此需要资源

到2023年底，对生成式人工智能将需要多少能源的任何预测都是不准确的。例如，头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万户家庭的电力”等。与此同时，数据中心新闻等专业出版物的报道称，每机架的功率密度将上升到50kW或1...

生成式AI 2024-02-26 人工智能

835阅读

NUS尤洋团队开发扩散模型p-diff 像Sora一样直接打入AI底层

新加坡国立大学尤洋教授团队联合其他机构开发的p-diff扩散模型在AI领域引起热议。这项模型能以44倍的速度生成神经网络参数，得到了深度学习领域的重要人物LeCun的点赞。该模型的研发结合了自编码器的设计，通过正向和反向过程学习参数的分布，生成高质量的神经...

生成式AI 2024-02-26 人工智能

788阅读

出门问问开放大模型“序列猴子”开源数据集

出门问问宣布，将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集，命名为“序列猴子开源数据集1.0”。序列猴子，作为出门问问的核心技术之一，具备强大的通用表示与推理能力，已在问答系统、自然语言处理、机器翻译、文本摘要等多个领域展现出其卓越的性能，...

大数据 2024-02-26 人工智能

875阅读

打入AI底层！NUS尤洋团队用扩散模型构建神经网络参数，LeCun点赞

扩散模型，迎来了一项重大新应用—— 像Sora生成视频一样，给神经网络生成参数，直接打入了AI的底层！这就是新加坡国立大学尤洋教授团队联合UCB、Meta AI实验室等机构最新开源的研究成果。具体来说，研究团队提出了一种用于生成神经网络参数的扩散模...

AIGC 2024-02-26 人工智能

802阅读

谷歌AI视频再出王炸！全能通用视觉编码器VideoPrism，性能刷新30项SOTA

AI视频模型Sora爆火之后，Meta、谷歌等大厂纷纷下场做研究，追赶OpenAI的步伐。最近，来自谷歌团队的研究人员提出了一种通用视频编码器——VideoPrism。它能够通过单一冻结模型，处理各种视频理解任务。图片论文地址：https://a...

大数据 2024-02-26 人工智能

892阅读

Stable Diffusion之最全详解图解

Stable Diffusion之最全详解图解 1. Stable Diffusion介绍 1.1 研究背景 1.2 学术名词 2.Stable Diffusion原理解析 2.1 技术架构 2.2 原理介绍扩散过程 3.1 Diff...

AIGC 2024-02-26 人工智能

1522阅读

GPT-4正接管人类数据专家！先验知识让LLM大胆预测，准确率堪比传统方式

在数据科学中，AI研究员经常面临处理不完整数据集的挑战。然而，许多已有的算法根本无法处理「不完整」的数据序列。传统上，数据科学家会求助于专家，利用他们的专业知识来填补空白，然而这一过程既耗时，却又不实用。如果AI可以接管专家的角色，又会如何呢？近...

大数据 2024-02-26 人工智能

781阅读

Sora文生视频模型怎么用？OpenAI官方最全演示案例视频、Prompt中文提示词汇总整理及详细教程使用入口地址

OpenAI 最近发布了一款名为 Sora 的「文生成视频」模型，只需输入文字即可生成一段 60 秒的惊人视频。对于 Sora 的连日刷屏引爆全网，有券商表示，近期随着 Sora 的出现，一些人认为这标志着...

AIGC 2024-02-23 人工智能

1353阅读

人脸识别要完？首个“人脸劫持“银行木马诞生

多年来，生物识别技术被宣传为终极身份验证手段，因为每个人的面部、指纹和虹膜信息都独一无二且难以被伪造。然而，随着人工智能技术的井喷式发展，生物识别技术，尤其是人脸识别技术正面临巨大威胁。近日，网络安全公司Group-IB发现了首个能够窃取人脸（识别数...

大数据 2024-02-23 人工智能

826阅读

EgoGen官网体验入口微软AI合成数据生成自我感知工具使用指南

EgoGen是一个用于生成以自我为中心的合成数据的系统，它能够模拟头戴设备（HMDs）的相机装置，并从相机佩戴者的视角渲染多种传感器数据。该系统提供了丰富的多模态数据和准确的注释，适用于自我感知任务。点击前往EgoGen官网体验入口谁可以从EgoGe...

人工智能 2024-02-23 人工智能

884阅读

OpenAI工程师必备经典《苦涩的教训》，原来20多年前就有了原型

OpenAI 推出视频生成模型 Sora 已经一周的时间了，热度不减，作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」，Sora 一次生成并自己完成剪辑。当然，一个个生动、逼真的 AI 视频让人们好奇为什么是 O...

大数据 2024-02-23 人工智能

848阅读

谷歌杀入开源大模型，单挑Meta Llama2，凭什么问鼎王座？

撰稿丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）兵贵神速。在大模型的必争之地，谷歌却总是慢人一步，因而屡屡被调侃“起了大早，赶个晚集”。但昨日，谷歌却突放大招，发布了一款开放模型——Gemma，并声称其是轻量级中“最先进的”开放模型...

生成式AI 2024-02-22 人工智能

926阅读

Gemma.cpp官网体验入口谷歌Gemma AI模型下载地址

Gemma.cpp是谷歌为Gemma模型开发的轻量级、独立的C++推理引擎。它专注于为Gemma 2B和7B模型提供简洁、直接的实现，旨在支持研究和实验用例，易于嵌入其他项目且具有高度的可修改性。gemma.cpp利用Google Highway库，优化了...

人工智能 2024-02-22 人工智能

1004阅读

爆火Sora的背后 | 聊聊什么是world models！

本文经自动驾驶之心公众号授权转载，转载请联系出处。随着媒体狂炒Sora，OpenAI的介绍材料中称Sora是 “world simulator”，世界模型这个词又进入视野，但很少有文章来介绍世界模型。这里回顾一下什么是世界模型，以及讨论Sora是不是...

AIGC 2024-02-22 人工智能

890阅读

Sora到底是如何工作的？

译者 | 布加迪审校 | 重楼上周OpenAI团队推出了Sora这一大规模视频生成模型，展示了模拟物理世界基本方面的新功能。我关注文本生成视频这个领域已有很长一段时间，我认为这个模型代表了质量方面的突飞猛进。我在Reddit和Twitter上看到...

AIGC 2024-02-22 人工智能

814阅读

成功！马斯克官宣首个Neuralink脑机接口人类，意念操控鼠标，全民机器人时代来了？

就在刚刚，马斯克宣布，第一个植入Neuralink的人类患者，已经可以通过思考移动计算机鼠标了！「进展良好，患者似乎已经完全康复，没有我们所知道的不良影响。患者只需动动脑子，即可在屏幕上移动鼠标。」此前发布的演示这个消息太炸裂了。从今天起，人类正...

大数据 2024-02-21 人工智能

870阅读

单GPU就能压缩模型，性能不变参数少25%！微软提出模型稀疏化新方法

众所周知，对于大语言模型来说，规模越大，所需的算力越大，自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域，即模型的稀疏化（Sparsification）。今天要介绍的SliceGPT，则可以实现模型的事后稀疏。也就是说，在一个模型训练完了以...

AIGC 2024-02-21 人工智能

889阅读

被字节辟谣的中文版Sora，究竟厉害在哪里？

撰稿 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）近日，市场有消息称，在Sora引爆文生视频赛道之前，国内的字节跳动也推出了一款新型视频模型Boximator，与Gen-2、Pink1.0等既有模型相比，Boximator的独特...

生成式AI 2024-02-21 人工智能

869阅读

人工智能会统治世界吗？

在技术飞速进步的时代，人工智能(AI 是否最终会统治世界这一迫在眉睫的问题是值得商榷的。曾经只是科幻小说中虚构的东西现在已经成为专家们合理的担忧，引发了关于人工智能进步的潜在影响的激烈辩论。虽然直接从《终结者》电影中得出的反乌托邦未来的概念听起来有些夸张...

大数据 2024-02-21 人工智能

908阅读

深度学习在时间序列预测的总结和未来方向分析

2023年是大语言模型和稳定扩散的一年，时间序列领域虽然没有那么大的成就，但是却有缓慢而稳定的进展。Neurips、ICML和AAAI等会议都有transformer 结构(BasisFormer、Crossformer、Inverted transf...

生成式AI 2024-02-21 人工智能

917阅读

Sora为何出自OpenAI？一线员工作息时间线揭秘：我们疯狂地卷

为什么是 OpenAI 率先打造出了 Sora？现在全世界不论研究员、工程师还是投资人都在问这个问题。最近几天，人们对于视频大模型 Sora 的讨论热度持续升高，信息早已破了圈，相关的投资热点都已经出现了两轮。 Sora 生成的「Flower ti...

AIGC 2024-02-21 人工智能

830阅读

PixelPlayer官网体验入口 AI音频视觉分离工具免费在线使用地址

PixelPlayer是一项革命性的工具，可以通过观看大量无标注视频学会定位产生声音的图像区域并分离输入声音成一组表示每个像素声音的组件的系统。该系统利用视觉和听觉双模态的自然同步特点，在无需额外人工标注的情况下学习联合解析声音和图像模型。通过大量训练视频...

人工智能 2024-02-21 人工智能

1030阅读

更乱了！已经有真人视频冒充Sora了，威尔·史密斯吃意大利面玩梗

今天，一个有关「威尔・史密斯吃意大利面」的视频正在社交媒体疯传。视频画面分为上下两段：上半段显示是「一年以前的 AI 视频」，下半段则显示「现在的 AI 视频」。众所周知，对于 AI 来说，生成「威尔・史密斯吃意大利面」的视频并不容易，人物的手、面条...

人工智能 2024-02-21 人工智能

849阅读

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩

耗费的计算资源仅为传统Stable Video Diffusion（SVD）模型的2/25！ AnimateLCM-SVD-xt发布，一改视频扩散模型进行重复去噪，既耗时又需大量计算的问题。先来看一波生成的动画效果。赛博朋克风轻松驾驭，男孩头戴耳机，...

大数据 2024-02-20 人工智能

919阅读

Meta、谷歌、特斯拉，竞争对手联合起来吐槽OpenAI！Sora不懂物理世界，它只是GPT3！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）上周，OpenAI的第一个视频生成模型Sora在互联网上疯传。然而，与此同时，来自竞争对手公司的一批人工智能专家和研究人员迅速剖析和批评了Sora的Transformer模型，引...

AIGC 2024-02-20 人工智能

812阅读

为什么人工智能应该开源？

在当今快速发展的数字时代，人工智能几乎处于所有行业革命性创新的前沿。从医疗保健、教育到娱乐，人工智能的变革性影响是显而易见的。什么是开源人工智能? 开源人工智能是人工智能软件和工具，其源代码开放并向公众开放。开发人员、研究人员和其他感兴趣的各方可以访...

生成式AI 2024-02-20 人工智能

801阅读

Gemini一眼识破Sora视频是AI生成？百万token上下文能力碾压GPT-4

当谷歌Gemini 1.5，遇上抢了它头条的「罪魁祸首」Sora会怎么样？这两天，拿到内测资格的AI圈大佬们，纷纷给广大网友来了一波在线测试。这不，Gabor Cselle就让Gemini 1.5去分析了那个著名的樱花雪景视频。对此，Gemini...

AIGC 2024-02-20 人工智能

866阅读

Groq官网体验入口人工智能AI自然语言处理工具免费在线使用地址

Groq是一种 AI 语言接口，提供强大的自然语言处理能力，助您快速解决问题。无限制解除，轻松编程。点击前往Groq官网体验入口 Groq 的使用对象主要包括开发者、研究人员、学生等需要处理大量文本和代码的用户群体。这款工具具备自然语言处理和问题解决的...

生成式AI 2024-02-20 人工智能

842阅读

文档翻译中的人工智能：效率新时代

如今，跨语言的有效沟通比以往任何时候都更加重要。无论是企业拓展新市场、研究人员在国际项目上进行合作，还是个人在世界各地寻找信息，准确高效地翻译文档的能力都至关重要。幸运的是，随着人工智能(AI 的进步，我们正在见证文档翻译效率的新时代。人工智能在翻译...

生成式AI 2024-02-20 人工智能

870阅读

微软谷歌加码投资欧洲大量建设AI基础设施

2月19日据报道，谷歌母公司Alphabet和微软日前都宣布，在欧洲人工智能（AI）领域投入巨资，抢在欧盟出台新的AI法规之前，重塑他们的AI基础设施。谷歌投资法国法国财政部在2月14日的一次新闻发布会上表示，谷歌在巴黎最新成立的AI中心最终将容...

大数据 2024-02-20 人工智能

837阅读

魅族停止传统手机新项目，换跑AI；周鸿祎：Sora打不败TikTok；宝马承认发生数据泄露事件；Sora视频被曝多处失误 | T资讯

一、商业圈 1.宝马确认发生数据泄露事件：宝马云存储服务器配置错误据外媒 TechCrunch 近日报道，汽车巨头宝马的云存储服务器发生配置错误事件，导致私钥和内部数据等敏感信息暴露。此次暴露的数据包括宝马在中国、欧洲和美国的云服务私钥，以及宝马生...

人工智能 2024-02-20 人工智能

887阅读

揭秘Sora技术路线：核心成员来自伯克利，基础论文曾被CVPR拒稿

最近几天，据说全世界的风投机构开会都在大谈 Sora。自去年初 ChatGPT 引发全科技领域军备竞赛之后，已经没有人愿意在新的 AI 生成视频赛道上落后了。在这个问题上，人们早有预判，但也始料未及：AI 生成视频，是继文本生成、图像生成以后技术持续发...

生成式AI 2024-02-20 人工智能

878阅读

GitHub热榜第一：百万token上下文，还能生成视频，UC伯克利出品

今日GitHub热榜榜首，是最新的开源世界模型。上下文窗口长度达到了100万token，持平了谷歌同时推出的王炸Gemini 1.5，伯克利出品。强大的模型，命名也是简单粗暴——没有任何额外点缀，直接就叫LargeWorldModel（LWM）。...

AIGC 2024-02-20 人工智能

876阅读

AI自动化标注崛起，数据标注员要失业了？

在数据标注行业流行着一句话：“有多少智能，就有多少人工”。由于需要标注的数据规模庞大且成本较高，一些互联网巨头及一些AI公司很少自己设有标注团队，大多交给第三方数据服务公司或者数据标注团队来做。这也衍生出了专为AI而生的人力密集型的数据标注产业链。...

人工智能 2024-02-19 人工智能

1082阅读

研究：ChatGPT 的营养建议对非传染性疾病患者有限

一项最新研究发现，ChatGPT在处理患有多种非传染性疾病（NCDs）的患者的营养咨询方面存在一定的局限性，无法替代医疗专业人员的咨询。这项研究由意大利都灵的研究人员进行，他们利用由OpenAI开发的Chat Generative Pretrained T...

AIGC 2024-02-19 人工智能

839阅读

生成式人工智能（AIGC）之最全详解图解

生成式人工智能（AIGC）之最全详解图解 1. AIGC的发展历程 1.1 AIGC演化重要时间节点 AIGC发展历程图 OpenAI大语言模型发展进程 1.2技术推进路线 2.AIGC技术场景 2.1 技术场景 3.1AIGC相关应用...

生成式AI 2024-02-18 人工智能

2493阅读

什么是预训练Pre-training—— AIGC必备知识点，您get了吗？

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 随着人工智能(AI 不断重塑我们的世界，其发展的一个关键方面已经成为现代机器学习模型的支柱:预训练。在本篇文章中，我们将探讨预训练的概...

人工智能 2024-02-17 人工智能

2813阅读

从声音到形象，AIGC 赋能的 TT 语音年度盛典有多好玩？

摘要： 23年是 AIGC 暴热的一年，这一年我们既兴奋又彷徨。兴奋之处在于新技术持续突破，业界“百模大战”的白热化，一些创新应用开始崭露头角，例如 ChatGPT 和 DALL·E 3，Midjourney，HeyGen，星野，Copilot 等。彷...

大数据 2024-02-17 人工智能

999阅读

AIGC内容分享(五十五)：AIGC周刊

目录行业资讯产品推荐学习资料拓展阅读 Midjourney生成 the camera focuses on the young woman, her red Hanfu a stark contrast against...

大数据 2024-02-16 人工智能

893阅读

科技部出手！科研人员的 AIGC 使用手册来了，学术界开始防范 AI 枪手

篡改实验数据、实验图片造假、论文不当署名、教材编写抄袭……1 月 16 日下午，华中农业大学的 11 名学生「一纸诉状」，以一份 125 页的举报材料实名举报该校黄姓教授存在学术不端行为。一时间，舆论迅速发酵，「赌上前程捍卫学术清白」、「人人都是学术造假受...

AIGC 2024-02-15 人工智能

843阅读

AIGC到底是个啥? AI和AIGC的区别有哪些

一、AIGC到底是个啥？说来说去，到底什么是AIGC呢？AIGC是人工智能生成内容的缩写，是一种基于生成对抗网络（GAN）、大型预训练模型等人工智能技术的方法，通过对已有数据进行学习和模式识别，以适当的泛化能力生成相关内容的技术，AIGC的应用领域有很...

大数据 2024-02-15 人工智能

2815阅读

OpenAI为ChatGPT加入记忆功能！可以记住你的提问内容啦

2月14日凌晨，OpenAI在官网宣布，正在测试ChatGPT记住用户提问内容的能力，同时可以自由控制其内存。该功能使用户不必频繁地提问相同的内容，ChatGPT都将记住那些内容并对长对话、个性化聊天等，例如，写长文小说;长期健康追踪;个性化编程习惯等，...

人工智能 2024-02-14 人工智能

1006阅读

GPT-4绝对性能暴涨74.4%！UIUC苹果华人团队提出CodeAct，用Python代码统一LLM智能体行动

一直以来，LLM智能体被众多业界AI大佬看好，甚至有望成为将人类从琐碎工作中解放出来的利器。但是，它们该如何与世界进行最佳互动? 最近，来自UIUC和苹果的华人研究员，提出了一种全新的智能体框架——CodeAct。它通过采用可执行的Python代码，来...

大数据 2024-02-13 人工智能

1042阅读

每日一看大模型新闻（2023.12.13）趣味项目CLoT:训练LLM更幽默地回答问题；用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习；2.7B能打Llama 2 70B，微软祭出

1.产品发布 1.1 2.7B能打Llama 2 70B，微软祭出「小语言模型」发布时间：2023-12-13 2.7B能打Llama 2 70B，微软祭出「小语言模型」！96块A100 14天训出Phi-2，碾压谷歌Gemini na...

大数据 2024-02-13 人工智能

1018阅读

【ScienceAI Weekly】AI+生物凝聚物初创公司宣布裁员15%；科技部明确科研中的AIGC红线；讯飞医疗递表港交所

AI for Science 的新成果、新动态、新视角—— 全球首家将生物分子凝聚体应用于药物发现的公司，宣布裁减 18 个职位谷歌 DeepMind 发布 AlphaGeometry Evaxion Biotech 宣布用 AI 开发定制癌症疫苗...

人工智能 2024-02-11 人工智能

963阅读

微软开源 SliceGPT:大模型体量压缩25%左右，性能保持不变

微软和苏黎世联邦理工学院的研究人员联合开源了 SliceGPT，该技术可以极限压缩大模型的权重矩阵，将模型体量压缩25% 左右，同时保持性能不变。实验数据显示，在保持零样本任务性能的情况下，SliceGPT 成功应用于多个大型模型，如 LLAMA-270B...

AIGC 2024-02-11 人工智能

824阅读

酒精和肠内外健康：有帮助还是有害？

谷禾健康酒精与健康饮酒作为一种特殊的文化形式，在我们国家有其独特的地位，在几千年的发展中，酒几乎渗透到日常生活、社会经济、文化活动之中。据2018年发表的《中国饮酒人群适量饮酒状况》白皮书数据显示，中国饮酒人...

AIGC 2024-02-10 人工智能

973阅读

Stable diffusion使用和操作流程

Stable Diffusion是一个文本到图像的潜在扩散模型，由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型，可以生成包括人脸在内的任何图像，因...

人工智能 2024-02-10 人工智能

965阅读

看看 ChatGPT 和文心一言哪个更好用？

文心一言这样说： ChatGPT和文心一言分别适用于不同的领域，具体取决于它们的功能和优势。 ChatGPT适用于多个领域，其中最常见的包括：对话系统：ChatGPT具有出色的自然语言处理能力，可以用于构建各种类型的对话系统，如客服...

大数据 2024-02-10 人工智能

1084阅读

Stability、Midjourney、Runway在AI艺术诉讼中强烈反击

艺术家对提供AI图像和视频生成器及其机器学习（ML）模型的公司提起的集体版权侵权案近日出现新进展。Stability AI、Midjourney、Runway和DeviantArt的律师在美国加利福尼亚北区地方法院提出了一系列新动议，包括完全驳回案件的动议...

生成式AI 2024-02-10 人工智能

906阅读