-
【Stable Diffusion】ControlNet基本教程(一)
1.ControlNet是什么 ControlNet是Stable Diffusion用于图像风格迁移和控制的一款插件,作者是2021年才本科毕业,现在在斯坦福大学读博士一年级的中国学生张吕敏。ControlNet的出现代表着 AI 生成开始进入真正可控的...
-
Stability AI推出视频生成模型Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的视频生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成视频。与其他AI公司不同,Stable Video Di...
-
Stable Diffusion中人物生成相关的negative prompts
下面是常用的negative prompt,在使用stable Diffusion webui等工具生成时可以填入。 bad anatomy, bad proportions, blurry, cloned face, deformed, disfigur...
-
谷歌 Deepmind 推出 Lyria AI 音频模型,可生成带有乐器和人声的音乐
11 月 21 日消息,Deepmind 日前推出了一款名为 Lyria 的音频模型,可用于生成带有乐器和人声的音乐。此外 Deepmind 还通过与 YouTube 合作,整合 Lyria 模型开发了音乐创作工具 Dream Track,声称可令...
-
谷歌Bard「破防」,用自然语言解开,提示注入引起数据泄漏风险
大型语言模型在生成文本时非常依赖提示词。这种攻击技术对于通过提示词学习模型而言可谓是「以彼之矛,攻己之盾」,是最强长项,同时也是难以防范的软肋。 提示词分为系统指令和用户给出的指令,在自然语言中,这两者难以区分。如果用户有意在输入提示词时,模仿系统指令,...
-
AMD显卡Ubuntu20.4系统下部署stable diffusion
今天来给大家做一个AMD显卡使用stable diffusion的小白(硬核)教程。最近这段时间AI特别火,很多小伙伴看到各种大佬用AI画的老婆非常精美(色情),弄的人心痒痒,自己也想画一个心仪的老婆(画作)。...
-
AI视野:ChatGPT测试新功能“从聊天中学习”;Kimi Chat全面开放服务;文心生物计算大模型宣布升级;Meta发布AI视频编辑工具Emu Video;贾跃亭也开始搞AI了
???AI新鲜事 ChatGPT测试新功能“从聊天中学习” ChatGPT测试新功能,能学习用户历史聊天、理解偏好,还支持重置记忆和阅后即焚功能,使其更像个性化的朋友。 【AiBase提要:】 ? 学习历史聊天: ChatGPT将能够在一个新的“My C...
-
Google DeepMind推AI音乐生成模型Lyria:用AI将文本转化为独特音乐作品
Google DeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。这一创新是谷歌旗下视频分享平台YouTube的新功能的一部分,旨在让用户能够轻松生成自己的音乐作品。 Lyria的设...
-
YouTube 推出可模仿著名歌手的 AI 工具,可用文字或哼唱创作歌曲
11 月 16 日消息,YouTube 正在测试新的生成式 AI 功能,让用户可以通过输入文本或哼唱一段旋律来创作音乐。其中一个功能叫做 Dream Track,已经向平台上的一些创作者提供,它可以根据著名艺人的风格自动生成 30 秒的音乐片段。该功能可...
-
谷歌 DeepMind 推出人耳无法察觉的 AI 音频水印技术 SynthID
Google DeepMind 的 AI Lyria 模型创建的音频,包括使用 YouTube 新音频生成功能制作的曲目,将使用 SynthID 水印标记,以便人们在事后识别它们的 AI 生成来源。 在一篇博客文章中,DeepMind 表示这种水印人耳不...
-
gpts怎么用?1分钟教你如何创建属于自己的GPTs
近期,大多数人获得了 ChatGPT 的访问权限,而GPTs的受欢迎程度令人惊讶。openAI 的 Sam Alman 表示,自 Dev Day 后的使用激增已经超过了他们的承受范围。这项 GPT 功能似乎是一个巨大的成功,以至于暂停了新的 Chat GP...
-
YouTube推AI音乐功能,用户可与流行歌手的虚拟声音合作制作音乐
YouTube宣布推出一项名为Dream Track的新AI音乐实验,为用户提供与知名艺术家虚拟声音合作制作音乐的机会。此实验是一个基于文本的功能,允许用户通过描述歌曲的情感或概念来提出歌曲请求,然后由人工智能生成相应的音乐。 图源备注:图片由AI生成,...
-
YouTube赚钱新思路!教你如何用AI制作儿童动画视频月赚5万美金
在儿童领域创作YouTube视频,尤其是面向儿童的内容,一直以来都是一个备受关注的话题。近期,有一个针对儿童创作的YouTube频道引起了广泛的关注,其粉丝和播放量都非常可观。尽管该频道目前已经停止更新,但第三方对其频道的分析显示,即便长时间没有新内容,单...
-
0门槛!用ChatGPT只花1天批量生成300个爆火TikTok视频
不露脸,不怕视频也能从TikTok赚到钱?在过去30天,有人通过这个方式预计至少获得了超过1万美金的广告分成收益。这些成功账号的共同特点是,所有内容都是利用自动化流程批量生产出来的,而且不需要自己拍摄视频或者露脸,却能够获得巨大的收益。利用当下最火的AI人...
-
AI视野:微软推自主研发AI芯片Maia100;WPS AI开启公测;OPPO发布安第斯大模型AndesGPT;DeepMind发布新模型Mirasol3B
???AI新鲜事 微软正式宣布其首款人工智能芯片 Maia100 微软宣布推出首款自主研发的AI芯片Maia100,旨在训练大型语言模型,并推出基于Arm架构的通用计算芯片Cobalt100,以优化云计算工作负载。 金山办公WPS AI开启公测,小米14...
-
秋叶StableDiffusion-webUI安装roop插件排雷记
秋叶StableDiffusion-webUI安装roop插件排雷记 参考资料 安装步骤: 排雷记录 报错一: 报错二: 换脸失败: 按照网上视频教程,屡试不不成功,通过命令床报错逐个排查,有些思路值得整理。 参考资料 Y...
-
微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
世界各地的人们每天都会创造大量视频,包括用户直播的内容、短视频、电影、体育比赛、广告等等。 视频是一种多功能媒介,可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法,就能帮助人们设计出具备强大能力的认知机器 —— 它不...
-
最强大模型训练芯片H200发布!141G大内存,AI推理最高提升90%,还兼容H100
英伟达老黄,带着新一代GPU芯片H200再次炸场。 官网毫不客气就直说了,“世界最强GPU,专为AI和超算打造”。 图片 听说所有AI公司都抱怨内存不够? 这回直接141GB大内存,与H100的80GB相比直接提升76%。 作为首款搭载HBM3e内存的G...
-
智能视频总结工具BibiGPT 快速提取关键信息
BibiGPT是一款基于人工智能的视频总结工具,通过先进的语言模型和自然语言处理技术,能够自动提取视频和音频的关键信息,生成简洁而准确的摘要。用户只需复制粘贴视频链接或上传本地文件即可获得总结。 体验地址:https://bibigpt.co/ Bibi...
-
ChatGPT 正在为一种新型 Snapchat 滤镜提供支持
Snapchat 在其年度开发者活动 Lens Fest 上宣布了一项新的更新,即将推出使用 ChatGPT 的增强现实滤镜。 开发者可以使用 Lens Studio 的新测试版创建具有 ChatGPT 的滤镜。Snap 在一个示例镜头中展示了一个以太阳系...
-
AI抢影视博主饭碗?阅片无数的AI,开始批量推荐“电子榨菜”
吃饭五分钟,找剧两小时。很多时候饭菜凉了,下饭剧还没找到…… 谁没有过这样的经历:在视频平台上为了找到满意的电视剧,长时间滚动翻看,直到眼花缭乱,也没有按下播放键。 不过,部分视频平台可能意识到了这个问题,开始在自己的搜索栏里布局AI功能,帮助观众改善选择...
-
一秒钟变身明星:用swapface软件体验星光熠熠的感觉!
你是否曾经想过能够用电脑或手机来实时地将自己的面部与其他人或角色进行交换?你是否曾经想过能够用一款简单易用的软件来制作出有趣或惊艳的面部交换直播、视频或图片?如果你的答案是肯定的,那么你一定要试试swapface软件,这是一款由Swapface开发的面...
-
谷歌承包商员工投票成立工会:希望维护自己的权益
2018年11月1日,作为全球工作场所问题抗议活动的一部分,一些员工在谷歌的英国分支机构抗议 据外媒报道,谷歌一家承包商的员工日前投票成立了一个工会,其中一些成员曾参与谷歌搜索和AI聊天机器人Bard的开发和服务。 这些员工来自谷歌的一家承包商埃森哲,...
-
深度解读 ChatGPT、技术原理(AIGC | State Of ChatGPT)
图来自:State of GPT | BRK216HFS : https://www.youtube.com/watch?v=bZQun8Y4L2A State of GPT | BRK216HFS [bZQun8Y4L2A]...
-
深度解析 Llama 2 的资源汇总:不容错过
“ 探索 Llama 2 背后的过程,包括了模型的全面解析,在线体验,微调,部署等,这份资源汇总将带您深入了解其内涵。” 01 — 周二发布了文章《中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用》后,不少朋...
-
Stable Diffusion Lora模型训练详细教程
1. 介绍 通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自己的训练好...
-
AI插件诱导注入数据外泄漏洞曝光 攻击者可以将恶意指令注入Google Bard
近期,Google Bard推出了强大的扩展功能,使其能够访问YouTube、搜索航班和酒店,以及用户的个人文档和电子邮件。然而,这也为潜在的安全漏洞敞开了大门。 国外一博主介绍了一种称为间接提示注入的攻击方法,利用这一漏洞,攻击者可以将恶意指令注入Goo...
-
Sam Altman放豪言:OpenAI训GPT-5不差钱,人类已接近AGI阈值
「OpenAI的最终目标为什么是AGI?什么是AGI?」 「ChatGPT以及其他语言模型的用途是什么?」 「人类与人工智能的关系在未来会发生什么变化?」 在2023年《华尔街日报》(WSJ)的科技新闻发布会上,OpenAI的首席执行官Sam Altma...
-
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;美团首个AI产品“Wow”亮相;百家号AI笔记功能将下线
???AI新鲜事 OpenAI发布GPT-4Turbo和自定义GPTs服务 在OpenAI首届开发者大会DevDay活动上,OpenAI发布了GPT-4Turbo模型和自定义GPTs服务,以及其他新功能和API,如Assistants API和新的模态AP...
-
YouTube测试生成式AI功能:包括YouChat工具和AI总结评论
Google旗下的YouTube宣布,他们正在为其高级订阅用户推出一系列实验性生成式人工智能功能。这一系列功能旨在提升用户对内容的互动和理解。 最引人注目的功能之一是名为“YouChat”的工具。YouTube表示,这将帮助观众更深入地了解他们正在观看的...
-
这些浏览器中的 AI 扩展太香了
众所周知,浏览器只有添加了扩展才能让其火力全开,效率翻倍,而当有了AI的加持后,直接起飞。 本期将整理一些目前非常火的基于AI语言模型的扩展程序,大大提高生产力,一起看看吧! ChatGPT for Google https://chrome.go...
-
YouTube 测试新的 AI 驱动聊天机器人「YouChat」以增强观看体验
YouTube 正在测试一款新的人工智能聊天机器人,能够与观众交谈,让他们「更深入地了解他们正在观看的内容。」 YouTube 宣布,这个新的交流工具将提供「对你正在观看的视频的问题的回答,相关内容的推荐等,所有这些都不会中断播放。」这项名为「YouCh...
-
YouTube Music推出AI定制播放列表封面功能
YouTube Music最近发布了一项令音乐爱好者兴奋的创新功能,它使用尖端的生成式AI技术,让用户可以创建个性化的播放列表封面艺术。这一功能最初仅对美国英语用户开放,但计划在未来扩展到其他国家和地区。 这一创新功能允许用户用独特的视觉元素来定制播放列...
-
强大AI字幕工具Kdenlive 可轻松剪辑视频
Kdenlive 是一款基于 MLT Framework 和 KDE Frameworks5的免费开源视频编辑软件。它拥有广泛的功能和工具,可帮助用户轻松编辑和制作视频内容。无论是专业视频编辑师还是初学者,Kdenlive 都提供了强大的工具,以满足各种视...
-
人工智能教程(一):基础知识
如今,计算机科学领域的学生和从业者绝对有必要了解人工智能artificial intelligence、数据科学data science、机器学习machine learning、深度学习deep learning方面的基本知识。但是应该从哪里开始呢?...
-
更高清写实的人体生成模型HyperHuman来了,基于隐式结构扩散,刷新多项SOTA
论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机 随着扩散模型的兴起,一些典型...
-
波士顿动力推出 AI 集成的机器人狗 Spot:打造未来互动导游
波士顿动力公司近日推出了其新一代机器人狗 Spot,这是一种配备了聊天机器人技术的智能导游机器人。Spot 不仅能走动和交谈,还能以其独特的英国口音为游客提供场所导游服务。通过与 ChatGPT 及其他开源大型语言模型(LLMs)的集成,Spot 能够精准...
-
波士顿动力机器狗能开口聊天了!ChatGPT加持,对话机智妙语连珠
好家伙,波士顿动力机器狗,现在能直接开口说话了。 并且不同于Siri的“人工智障”,ChatGPT加持的狗,聊起天来那叫一个妙语连珠。 比如随口说一句:“我口渴了。” 它会直接给你领到咖啡柜台前,并回答: 我们这里有小吃店和咖啡机。这是我们的人类同事寻找...
-
财报拆解:微软押注生成式AI已有回报,谷歌还在挣扎
微软和谷歌发布财报,一家欢喜一家忧愁。由于大胆押注AI,微软开始获得一些回报,业绩不错。反观谷歌,核心业务增长乏力,虽然它也在积极投资新技术,但业绩并没有惊艳之处。 微软Azure增速加快,生成式AI贡献约3% 最近一个季度,微软获得营收565亿美元,...
-
利用 ChatGPT 等大模型训练,波士顿动力将 Spot 机器狗变成“会说话的导游”
▲ 图源波士顿动力公司 YouTube 视频截图 10 月 27 日消息,波士顿动力公司于数小时前在其官方 YouTube 频道上传了一段视频,展示了波士顿动力机器狗的“语言能力”。视频中,波士顿动力机器狗化身“导游”带领工作人员参观自家公司的各种设施。...
-
AI视野:百度开放文心4.0开发权限申请;腾讯混元大模型开放文生图功能;谷歌AI应用禁止生成受限内容;Midjourney新网站上线测试版
????大模型动态 百度开放文心4.0开发权限申请 在2023年百度世界大会上,百度发布了文心大模型4.0,提升了理解、生成、逻辑、记忆等四个方面,现在开发者可以申请使用 ERNIE Bot SDK 开发与接入该模型的应用。 申请地址:https://a...
-
YouTube Music 开始进行创建播放列表封面的生成式 AI 测试
YouTube Music 近日在美国地区启动了一项新的生成式人工智能测试,使用户能够为其播放列表创建艺术封面。此次测试体现了 YouTube 对音乐领域生成式 AI 的探索,同时也为用户提供了更丰富的个性化体验。 图片来自 YouTube 根据 You...
-
谷歌CEO皮查伊:正考虑为新的AI产品采用订阅模式
10月26日消息,在2023年第三季度财报电话会议上,谷歌及其母公司Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)表示,该公司可能会在某些新的人工智能(AI)产品中采用订阅模式。 在此次会议上,美国投行摩根士丹利分析师布莱恩·诺...
-
最新AI配音技术刷屏!声音克隆+口型同步,这下真的是“全世界都在说中国话”了
没开玩笑,现在的AI技术,能让全世界都说中国话。 继“AI孙燕姿”后,最近,有一条视频再次刷新了大众对于AI配音技术的认知。 10月19日,B站UP主“johnhuu”发布了一条题为“这才是没有译制片腔调的翻译”的视频。 视频一开头,霉霉正在用地道的普通话...