-
OpenAI CEO被董事会罢免36小时事件梳理
11月19日消息,美国时间11月17日周五,正值中国深夜时分,OpenAI在官网发布了一篇博文,声明OpenAI创始人兼CEO 山姆·阿尔特曼(Sam Altman)突遭公司董事会罢免,公司首席技术官米拉·穆拉蒂(Mira Murati)被任命为临时CEO...
-
AI绘画搭建教程
一、本地搭建 随着AI绘画热度的提高,网络上本地一键包也层出不穷,但这些一键包往往会有网盘下载时间长或版本老旧无法更新的问题,所以在此简单介绍一下通过github大佬整合的搭建方式。 环境需求: (1)一张不错的显卡 (2)稳定的魔法上网工具 这...
-
【CVHub】《万字长文带你解读AIGC》系列之入门篇
本文来源“CVHub”公众号,侵权删,干货满满。 作者丨派派星 来源丨CVHub 原文链接:《万字长文带你解读AIGC》系列之入门篇 0. 导读 图0 随着ChatGPT的病毒式传播,生成式人工智能(AIGC, a.k.a AI-gener...
-
AI绘画(sd webui)报错mat1 and mat2 shapes cannot be multiplied的处理
问题描述 在用webui转换游戏图标的风格时,使用controlnet固定图标样式,运行报错:RuntimeError: mat1 and mat2 shapes cannot be multiplied (154x1024 and 768x320 ,...
-
神经网络学习笔记6——生成式AI绘画背后的的GAN与Diffusion初解
系列文章目录 文章目录 系列文章目录 AI绘画 GAN前言 一、生成网络与判别网络的协同进化 1、生成器与判别器的学习趋向 2、部分算法理念 Diffusion 前言 一、Diffusion前向过程 二、Diffusion反向过...
-
AI视野:ChatGPT测试新功能“从聊天中学习”;Kimi Chat全面开放服务;文心生物计算大模型宣布升级;Meta发布AI视频编辑工具Emu Video;贾跃亭也开始搞AI了
???AI新鲜事 ChatGPT测试新功能“从聊天中学习” ChatGPT测试新功能,能学习用户历史聊天、理解偏好,还支持重置记忆和阅后即焚功能,使其更像个性化的朋友。 【AiBase提要:】 ? 学习历史聊天: ChatGPT将能够在一个新的“My C...
-
微软两款自研 AI 芯片 Maia 100 和 CobAlt 将由台积电代工:采用 5 纳米制程技术
据 DIGITIMES 消息,在本周三的 Ignite 开发者大会上,微软发布了两款自主研发的人工智能(AI)芯片:Maia 100 和 CobAlt。这两款芯片由台积电代工,采用 5 纳米制程技术,预计将于明年投入微软 Azure 数据中心,提升包括 O...
-
揭秘人工智能行业: 访问量最高的 50 个 AI 工具及其超过 24 亿次访问行为
最新研究数据显示,ChatGPT 在 AI 工具市场中占据主导地位,市场份额高达 60%。据 WriterBuddy.ai 发布的报告,人工智能在线上已成为「无处不在的力量」,50 个基于 AI 的网站在 11 个月内吸引了超过 24 亿次访问。 202...
-
Google DeepMind推AI音乐生成模型Lyria:用AI将文本转化为独特音乐作品
Google DeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。这一创新是谷歌旗下视频分享平台YouTube的新功能的一部分,旨在让用户能够轻松生成自己的音乐作品。 Lyria的设...
-
AI绘画热点模型大汇总,让你一次用个够
AI绘画热点模型大汇总,让你一次用个够 前段时间,在利用ControlNet重新定义你的AI姿势中提到了如何利用快捷方式节省谷歌硬盘,由于目前收集到的模型站点涉及的模型较少,且缺少lora模型。因此寻思着自己是不是也可以做一些热点模型的站点出来分享给大...
-
AI如何帮助IT领导者优化成本和降低风险
虽然在可预见的未来,AI可能是IT领导者的首要任务,但报告表明,全球持续的经济不确定性正在迫使CIO们寻找进一步的成本节约、降低风险的方法、拥抱平台的力量等。 围绕AI的兴奋和好奇心 围绕AI的兴奋和好奇心-以及随之而来的可能性-让整个行业沸沸扬扬,结...
-
谷歌 DeepMind 推出人耳无法察觉的 AI 音频水印技术 SynthID
Google DeepMind 的 AI Lyria 模型创建的音频,包括使用 YouTube 新音频生成功能制作的曲目,将使用 SynthID 水印标记,以便人们在事后识别它们的 AI 生成来源。 在一篇博客文章中,DeepMind 表示这种水印人耳不...
-
Fooocus:一个简单且功能强大的Stable Diffusion webUI
Stable Diffusion是一个强大的图像生成AI模型,但它通常需要大量调整和提示工程。Fooocus的目标是改变这种状况。 Fooocus的创始人Lvmin Zhang(也是 ControlNet论文的作者)将这个项目描述为对“Stable Di...
-
LCM-LoRA是什么?它如何让实时生成 AI 艺术成为现实
生成 AI 艺术已经成为新技术中最有趣和受欢迎的应用之一,例如 Stable Diffusion 和 Midjourney 等模型已经吸引了数百万用户的使用,此外,OpenAI 还在今年秋季将其 DALL-E3图像生成模型直接集成到其流行的 ChatGPT...
-
Windows安装Stable Diffusion WebUI及问题解决记录
本文将详细介绍stable diffusion webui的下载、安装及问题解决。 StableDiffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提...
-
使用Google Colab免费部署属于自己的Stable Diffusion模型在线服务
I. 介绍 Stable Diffusion模型(稳定扩散模型) 是一种用于生成式建模的深度学习模型,它使用随机微分方程(SDE)来建模连续时间的动态过程。在图像、声音、文本等各种领域都有广泛的应用。与传统的生成式模型相比,Stable Diffusi...
-
faster-whisper-webui
摘要 whisper开源之后,很多相关的衍生产品也开源了,比如faster-whisper,它是一个比whisper转录更快的技术实现,转录速度是whisper的4倍,并且占用的显存更少,占用显存是whisper的1/2。而我们这次要讲的是faster...
-
YouTube推AI音乐功能,用户可与流行歌手的虚拟声音合作制作音乐
YouTube宣布推出一项名为Dream Track的新AI音乐实验,为用户提供与知名艺术家虚拟声音合作制作音乐的机会。此实验是一个基于文本的功能,允许用户通过描述歌曲的情感或概念来提出歌曲请求,然后由人工智能生成相应的音乐。 图源备注:图片由AI生成,...
-
抢先微软,Google版Copilot上线!谷歌宣布给Google全家桶开放Bard功能
夕小瑶科技说 原创 作者 | 智商掉了一地、兔子酱 就在本月 5 号,Bard 和 Google Workspace 同步更新了一则新闻,宣布 Workspace 的团队用户即日起可以申请体验由 Bard 大模型驱动的生成式 AI 工具。...
-
谷歌向全球青少年开放Bard AI 聊天机器人
谷歌最近宣布,它正在向全球大多数国家13至16岁的青少年用户开放其新兴的BardAI 聊天机器人。只要青少年用户的语言设置为英语,并且满足管理自己 Google 帐户的最低年龄要求,他们就可以使用这个新功能。 与成人用户一样,青少年可以向Bard提出...
-
AI 绘画Stable Diffusion 研究(六)sd提示词插件
大家好,我是风雨无阻。 今天为大家推荐一款可以有效提升我们使用 Stable Diffusion WebUI 效率的插件, 它就是 prompt-all-in-one, 它不但能直接将 WebUI 中的中文提示词转换为英文,还能一键为关键词加权重,更能...
-
AI视野:微软推自主研发AI芯片Maia100;WPS AI开启公测;OPPO发布安第斯大模型AndesGPT;DeepMind发布新模型Mirasol3B
???AI新鲜事 微软正式宣布其首款人工智能芯片 Maia100 微软宣布推出首款自主研发的AI芯片Maia100,旨在训练大型语言模型,并推出基于Arm架构的通用计算芯片Cobalt100,以优化云计算工作负载。 金山办公WPS AI开启公测,小米14...
-
Google Photos推出AI功能,智能整理照片,分类更便捷
Google Photos日前推出了一系列新功能,利用人工智能技术更好地为您组织和分类照片。其中一个新功能称为“Photo Stacks”,Google将利用AI识别一组同时拍摄的照片中的“最佳”照片,并将其选为该组的顶部选择,以减少您的照片库中的混乱。另...
-
Whisper JAX 语音识别本地部署
https://nlpcloud.com/zh/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html whispe...
-
Google Cloud 推出 Vertex AI 新的数据存储位置功能
Google 云服务部今日宣布,为其全套管理型人工智能开发服务 Vertex AI 引入了新的数据存储位置功能。 在诸如金融、医疗等受严格监管的行业中,企业通常需要将数据存储在产生数据的国家或地区。Google Cloud 推出的这一新功能正是为了满足这...
-
Google Bard VS ChatGPT:哪个是更好的AI聊天机器人?
文章目录 前言 一、Bard和ChatGPT的宏观对比 二、应用场景不同 三、知识的时效性 四、未来的归宿 总结 前言 自从 OpenAI 向公众发布ChatGPT以来的过去几个月里,我们都见证了围绕 ChatGPT 的各种测评...
-
大模型幻觉排行榜GPT-4夺冠,英伟达科学家强力打假!Meta版ChatGPT一作发长文鸣冤
大模型的幻觉问题,是业内老生常谈的话题了。 最近,一个名为Vectara的机构,在GitHub推出了一个大模型幻觉排行榜。 结果显示,在总结短文档方面,GPT-4的表现最为优异,而Google Palm的两款模型直接垫底! 其中GPT-4的准确率为97...
-
成本2元开发游戏,最快3分钟完成!全程都是AI智能体“打工”,大模型加持的那种
家人们,OpenAI前脚刚发布自定义GPT,让人人都能搞开发;后脚国内一家大模型初创公司也搞了个产品,堪称重新定义开发——让AI智能体们协作起来! 只需一句话,最快3分钟不到,成本也只要2元多,“啪~”,一个软件就开发完了。 例如开发一个红包雨的小软件,现...
-
北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断
手是人类与世界交互的重要部分,手的缺失(如上肢残障)会大大影响人类的正常生活。 北京大学董豪团队通过将扩散模型和强化学习结合,使机械手能根据人手腕部的移动轨迹,自适应的抓取物体的不同部位,满足人类多样化的抓取需求,目前该工作已被NeurIPS 2023接...
-
使用Python从图像中提取表格
大约一年前,我被分配任务从文件中提取和结构化数据,主要是包含在表格中的数据。我之前对计算机视觉没有了解,并且很难找到一个合适的“即插即用”的解决方案。当时可选的方案要么是基于最新神经网络(NN)的解决方案,这些解决方案庞大而繁琐,要么是基于OpenCV的...
-
Stable Diffusion + AnimateDiff运用
1.安装AnimateDiff,重启webui 2.下载对应的模型,最好到c站下载,google colab的资源有可能会出现下载问题 https://civitai.com/models/108836 3.下载完成后,你可以随便抽卡了。 抽...
-
被OpenAI带火的Agent如何解放人力?清华等发布ProAgent
项目地址:https://github.com/OpenBMB/ProAgent 论文地址:https://github.com/OpenBMB/ProAgent/blob/main/paper/paper.pdf 在历史的长河中,自动化是人类技术...
-
苹果筹备 iPhone 16 Pro 的 AI 功能应对智能手机 AI 竞赛的挑战
随着 Google、高通和三星在其旗舰智能手机中大力推广 AI 技术,苹果公司面临在即将推出的 iPhone 16 Pro 中整合 AI 技术的紧迫挑战。 据 Bloomberg 的 Mark Gurman 报道,由于 iPhone 16 和 16 Pr...
-
【PaLM2】PaLM2 大语言模型与 Bard 使用体验
欢迎关注【youcans的学习笔记】原创作品,火热更新中 【Google I/O 2023】PaLM2 大语言模型与 Bard 使用体验 1. PaLM2 大型语言模型 1.1 谷歌发布 PaLM2 1.2 PaLM2 的功能与性能...
-
谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析
Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。 网友看了之后纷纷表示: 「终于,他们发了点普通人能看懂的东西了」。 「哦豁,这下懂了」 「对,就是这么简单!」 「太...
-
谷歌DeepMind给AGI划等级,猜猜ChatGPT在哪个位置
我们到底该如何定义 AGI(通用人工智能)?如果你要求 100 位 AI 专家进行解答,你可能会得到 100 个相关但不同的定义。 现阶段,AGI 是 AI 研究中一个重要且存在争议的概念,有研究者认为 AGI 已经出现在最新一代大语言模型(LLM)中;...
-
Stable Diffusion人工智能图像合成
AI 图像生成大有来头。新发布的开源图像合成模型称为Stable Diffusion,它允许任何拥有 PC 和像样的 GPU 的人想象出他们能想象到的几乎任何视觉现实。它几乎可以模仿任何视觉风格,如果你给它输入一个描述性的短语,结果就会像魔术一样出现在你的...
-
stable-diffusion安装教程推荐
总结:安装的时候VPN最重要,安装完成启动使用stable-diffusion关闭vpn 安装报错都是因为vpn问题,各种安装不了,报错基本上百度都有解决方法 安装看下面两基本上够了 Windows安装Stable Diffusion WebUI及...
-
Stable Diffusion使用controlnet报错 mat1 and mat2 shapes cannot be multiplied问题
Stable Diffusion使用controlnet报错 mat1 and mat2 shapes cannot be multiplied RuntimeError: mat1 and mat2 shapes cannot be multipl...
-
IDEA插件 Github Copilot无法授权出现“waiting for github authentication”的解决方法
Github Copilot这个插件十分好用,不仅能自动补全代码,写注释也是极其方便的。当安装这个插件时可能会遇到无法授权的问题,即出现waiting for github authentication,一直在走进度条的问题,根据老办法我们可以安装旧版本的...
-
【个人笔记本】本地化部署详细流程 LLaMA中文模型:Chinese-LLaMA-Alpaca-2
不推荐小白,环境配置比较复杂 全部流程 下载原始模型:Chinese-LLaMA-Alpaca-2 linux部署llamacpp环境 使用llamacpp将Chinese-LLaMA-Alpaca-2模型转换为gguf模型 windows部署...
-
还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
Midjourney虽然出图精美,使用方便,但是出图的灵活性方面是一大硬伤,Stable Diffusion 作为Midjourney的开源替代品,由于其丰富的插件,灵活可控,受到社区的热捧,一直被寄予厚望,这次Stable Diffusion发布了 XL...
-
[LLM+AIGC] 01.应用篇之中文ChatGPT初探及利用ChatGPT润色论文对比浅析(文心一言 | 讯飞星火)
近年来,人工智能技术火热发展,尤其是OpenAI在2022年11月30日发布ChatGPT聊天机器人程序,其使用了Transformer神经网络架构(GPT-3.5),能够基于在预训练阶段所见的模式、统计规律和知识来生成回答,还能根据聊天的上下文进行互动,...
-
NLP-分词器:SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】
背景 随着ChatGPT迅速出圈,最近几个月开源的大模型也是遍地开花。目前,开源的大语言模型主要有三大类:ChatGLM衍生的大模型(wenda、ChatSQL等)、LLaMA衍生的大模型(Alpaca、Vicuna、BELLE、Phoenix、Chim...
-
AI工具 ChatGPT-4 vs Google Bard , PostgreSQL 开发者会pick谁?
在人工智能 (AI 进步的快节奏世界中,开发人员正在寻找最高效和突破性的解决方案来加快和提高他们的工作质量。对于 PostgreSQL 开发人员来说,选择理想的 AI 支持的工具以最专业的方式解决他们的查询至关重要。 近年来,人工智能工具的普及率飙升,...
-
人工智能推动“电脑嗅觉”用于昆虫控制
机器嗅觉初创公司Osmo于2023年1月成立,获得由Lux Capital和Google Ventures领投的 6000万美元A轮资金。Osmo将机器学习、数据科学、心理物理学、嗅觉神经科学、电气工程和化学融合在一种多学科的气味数字化方法中。 Osm...
-
华人团队获最佳论文、最佳系统论文,CoRL获奖论文出炉
自 2017 年首次举办以来,CoRL 已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL 是面向机器人学习研究的 single-track 会议,涵盖机器人学、机器学习和控制等多个主题,包括理论与应用。 2023 年的 CoRL 大会...
-
【AIGC使用教程】Notion AI 从注册到体验:如何免费使用
欢迎关注【AIGC使用教程】 专栏 【AIGC使用教程】SciSpace 论文阅读神器【AIGC使用教程】Microsoft Edge/Bing Chat 注册使用完全指南【AIGC使用教程】GitHub Copilot 免费注册及在 VS Code...
-
各种文字生成图片的AIGC模型(openAI、谷歌、stable、Midjourney等)
1 前言 AIGC,全名“AI generated content”,又称生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、视频等。 本文主要描述文字生成图片的模型。而且目前扩散模型(Diffusion Models)流行,所以下...
-
AIGC技术发展和应用方向
AIGC(Artificial Intelligence Generated Content)是指通过人工智能技术生成的各种文本、图像、音频和视频等多媒体内容。AIGC技术是机器学习和自然语言处理等技术的结合,通过对海量数据的学习和分析,可以让计算机模拟人...