-
stable diffusion中的u net
Stable Diffusion 包含几个核心的组件: 一个文本编码器(在 Stable Diffusion 中使用 CLIP 的 ViT-L/14 的文本编码器),用于将用户输入的 Prompt 文本转化成 text embedding; 一个 Im...
-
chatGPT AI绘画
chatGPT的火爆带动了很多的想象,其实国内的厂商也实现过类似的功能,但是只是在影响力上没有那么大所以不为人知,但是有一点是肯定的那就是AI创作正在以前所未有的速度侵入这个世界, 可能十年之内我们看到的任何人类产生的事物都将带有AI的影子,我也在做这方...
-
Stable Diffusion实现AI绘画,尝试向实际业务迈进...
前置: 由于处于学习初期,懂得较少以及可能会出现理解错误等情况,故而文章仅供参考学习使用,旨在分享知识,共同学习,不能作为依据,如有错误,感谢指出,文章主题分为两部分,学习部分也就理论知识,实践部分主要包括问题及解决方案。 一、Stab...
-
浙大研究团队推新AI框架Human101:单视角视频构就能重建3D数字人
在虚拟现实领域,快速创建定制虚拟人物并实现与其互动是一个普遍的应用场景。然而,以往的方法在快速重建高保真3D数字人体和实时渲染之间往往难以平衡。在这项研究中,提出了Human101,这是一个新颖的框架,能够在仅一视角视频中以100秒的训练时间生成高保真的动...
-
文心一言代码能力测试:文心一言能否取代程序员?
文心一言代码协助能力使用体验,这篇博客基本上就是文心一言帮忙写的,素材是我和文心一言的对话,国产大语言模型确实取得了巨大的成就,在和文心一言对话的过程中感到未来已来,确实和之前的自动问答机器人不一样。对于文心一言之类的大语言模型能否取代程序员为企业完成业务...
-
文心一言实测:什么是文心一言?
我不了解百度,能用五百字向我介绍这个公司吗? 百度是一家全球领先的互联网公司,致力于为人们提供便捷、高效、智能的信息获取和交流服务。公司成立于2000年1月,总部位于中国北京。 百度在搜索引擎、AI技术、云计算等领域拥有强大的技术实力和丰富的产...
-
精选5大最强AI绘画网站,三步骤免费线上完成AI绘图!
AI 绘画风潮叠起! 看到好多漂亮的AI 绘图作品,也想自己生成图片看看吗?或是想透过AI 绘画来获得灵感,或让抽象的想法具象化? 本文整理了5 款最强AI 绘图线上工具,以及教你如何4 步骤完成AI绘图的详细教学,不需要很懂代码或绘画,也能轻松生成令...
-
PHO.TO官网体验入口 AI卡通头像生成器免费使用地址
PHO.TO是一款使用世界上首个基于AI的照片转卡通技术的在线工具,能够一键将照片转换成卡通图像。这款工具支持对单人、多人甚至全身照片进行卡通化处理,并且可以与Photo Lab的其他效果组合使用,提供丰富的调整选项。用户不仅可以获得卡通形象的个人头像,还...
-
AI绘画室内设计提示词大全(持续更新)
当你开始使用AI绘画进行室内设计(interior design)时,选择合适的提示词和关键概念对于成功构思和实现你的设计理念至关重要。以下是一些关于室内设计的提示词,涵盖了空间类型、设计风格、光线效果、布局规划、材料类型以及其他要求的详细...
-
15位大咖预测:2024年AI将改变网络安全游戏规则
随着AI技术的突破性发展,攻击者正在加速AI的武器化,结合社会工程技术让企业防不胜防;与此同时,在防御侧,AI也是CISO赢得人工智能军备竞赛的关键武器。 2024年,AI将如何改变网络安全的游戏规则?近日,科技媒体VentureBeat采访了13家公...
-
奥特曼挖走iPhone设计师,联手乔纳森造AI硬件
又一苹果高管被曝将加入OpenAI首个硬件设备研发项目中! 他就是苹果产品设计副总裁Tang Tan,曾参与iPhone、Apple Watch的产品设计。 彭博社消息称,Tang Tan预计明年二月份正式离任,而后加入Jony Ive创建的LoveFr...
-
ubuntu16.04安装语音识别whisper及whisper-ctranslate2工具(填坑篇)
环境:系统ubuntu16.04,显卡是NVIDIA Quadro RTX5000 目标:安装语音识别工具whipser/whipser-ctranslate2 因之前有过几次在linux和windows上有过部署whisper经验和...
-
AI生成视频工具Assistive Video 输入描述即可生成视频
Assistive Video是一款新的人工智能生成视频工具,用户只需输入描述所想看到内容的提示或上传图片,即可生成一段4秒钟的视频。 这项技术能够将零散的信息整合成一个连贯的视频脚本,让用户快速了解所需内容。用户可以控制视频质量、与提示的一致性、运动的强...
-
OpenAI员工:未来的关键技能不是提示工程,而是与人类沟通的能力
近日,一位OpenAI员工在社交媒体上发表看法称,未来关键的技能不是提示工程,而是阅读、写作和口语。他表示,与人类有效沟通的能力将在2024年成为真正重要的技能,即便是对于那些可能年薪六位数以上的提示工程师。 这位开发者在推特上表示:“热门观点:许多人认为...
-
谷歌 Android Auto 使用 Google Assistant 和 AI 总结消息
谷歌公司正在为其 Android Auto 平台开发一项新功能,该功能将利用谷歌助手和人工智能(AI)技术来总结信息。 根据 9To5Google 的报道,他们对上传到 Play 商店的谷歌应用程序 14.52 版本进行了反编译,并发现了这一功能的代码行...
-
【异常错误】pycharm copilot 错误:detected dubious ownership in repository ****** is owned by: 修改后无显示
问题描述: 今天在github git的时候,突然出现了这种问题,下面的框出的部分一直显示: detected dubious ownership in repository at 'D:/Pycharm_workspace/SBDD/1/FL...
-
Gemini vs GPT-4V到底哪家强?视觉-语言模型的全面比较和结合使用
概括 大家好,我是戚张扬,目前就读于香港大学,今天和大家分享一篇我们关于视觉语言模型最新的研究,这篇论文提供了对谷歌的Gemini和OpenAI的GPT-4V(ision 两个SOTA模型的深入定性比较研究。我们的研究涉及到对这两个模型在视觉语言能力、与...
-
AIGC笔记总结(二):扩散模型原理
?个人主页: GoAI |? 公众号: GoAI的学习小屋 | ?交流群: 704932595 |?个人简介 : 掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等,专注大数...
-
Outfit Anyone体验入口在哪 AI虚拟换衣软件推荐
Outfit Anyone 是一款虚拟试衣软件。该软件采用了基于生成式对抗网络(GAN)的技术,能够根据用户上传的照片,生成穿着不同服装的虚拟形象。Outfit Anyone的体验入口在哪呢,这里我们来看下Outfit Anyone的官方体验入口。 &g...
-
Stable Diffusion搭建问题记录
1、点击generator生成图片后,直接waiting一段时间后,直接断开没有任何提示! 这个问题是困扰我最久的一个问题,原因:本机开启了代理,代理将127.0.0.1解析到了别的地方,因此控制台无任何异常,前段报了一下类似socket的异常,太坑了,...
-
Stable Diffusion 免费升级 SDXL 1.0,哪些新特性值得关注?体验如何?5 分钟带你体验!
一、引言 7 月 26 日,Stability AI 发布了 SDXL 1.0,号称目前为止,最厉害的开放式图像生成大模型。 它到底有没有网上说的那么炸裂?真的已经实现了像 midjourney 一样 靠嘴出图 的功能吗?相对于之前的版本,增...
-
文心一言用户规模破1亿 今年10月基础模型升级到4.0
在第十届WAVE SUMMIT深度学习开发者大会上,百度CTO兼深度学习技术及应用国家工程研究中心负责人王海峰,发表了《文心加飞桨,翩然赴星河》的主题演讲。 百度从2019年开始专注于预训练模型的研发,推出了文心大模型1.0。经过近四年的不断优化,百度在...
-
McKinsey:人工智能驱动的方法可以加速建筑脱碳
简介 根据McKinsey11月29日发布的一份报告,通过应用机器学习、人工智能和基于物理的建模,建筑投资组合所有者可以更快地识别建筑脱碳机会。 通过使用来自卫星的数据、地理空间分析、法规、劳动力和设备成本,并评估供暖和冷却系统、绝缘水平以及太阳能或...
-
ElevenLabs体验入口在哪 AI语音转换软件推荐
ElevenLabs是一款涵盖了语音、图片、视频、文字等功能的AI软件,能够生成逼真的图片、视频、音乐、文字等创意内容。ElevenLabs的体验入口在哪呢,这里我们来看下ElevenLabs的官方体验入口。 >>>点击前往 Eleve...
-
【AIGC】图片生成的原理与应用
前言 近两年 AI 发展非常迅速,其中的 AI 绘画也越来越火爆,AI 绘画在很多应用领域有巨大的潜力,AI 甚至能模仿各种著名艺术家的风格进行绘画。 目前比较有名商业化的 AI 绘画软件有 Midjourney、DALL·E2、以及百度出品...
-
VSCode GitHub Copilot could not connect to server. Extension activation failed: “connect ETIMEDOUT
VSCode GitHub Copilot could not connect to server. Extension activation failed: "connect ETIMEDOUT VSCode 打开设置, 搜索 proxy, 设置为你...
-
ARC图片增强体验入口在哪 AI图片修复软件分享
ARC 图片增强是一款图片增强软件,该软件采用了基于深度学习的技术,能够提升图片的清晰度、亮度、对比度、色彩等,使图片更加逼真、生动。ARC 图片增强的体验入口在哪呢,这里我们来看下ARC 图片增强的官方体验入口。 >>>点击前往 AR...
-
人工智能在优化建筑性能中的作用
人工智能(AI)正在渗透到各个行业。从构思到改造,人工智能可以影响建筑环境。影响建筑性能的因素很多,人工智能可以减轻繁忙的管理人员的负担。人工智能还可以消除偏见,并在灾难发生之前阻止它。以下是人工智能如何在优化建筑性能方面发挥作用。 什么是建筑性能优化...
-
AI视野:Midjourney开始训练视频模型;文心一言用户破亿;优酷上线“AI搜片”功能;快手开源KwaiAgents系统
???AI新鲜事 Midjourney开始训练视频模型 Midjourney昨晚发布了重要消息,将开始视频模型训练,同时计划下周推出V6版本的重大更新。该更新将在文本处理方面有显著进步,提高内容连贯性和提示准确性。重点改进包括Inpainting功能和全新...
-
webotAI网页版上线啦!
国内终于也能玩ChatGPT啦!更智能的聊天,超清有趣的绘画,智能写作辅助办公。随着人工智能技术的快速发展,AI产品逐渐成为我们生活和工作中的得力助手。今天,我们为您推荐一款强大的AI产品—webotAI,它集AI聊天、AI写作和AI绘画于一身,为您提供全...
-
NASA 利用先进 AI 技术推动 Artemis 月球任务:VIPER 探测车引领探索
美国国家航空航天局(NASA)正积极准备雄心勃勃的阿尔忒弥斯(Artemis)任务,旨在将人类重新送回月球。该计划的一个重要支柱是集成先进的人工智能(AI)技术,特别是在挥发性物质探测极地探测车(VIPER)任务中。 VIPER 探测车:利用人工智能进行...
-
2023-12-20 AIGC-使用SD创建虚拟数字人
摘要: 2023-12-20 AIGC-使用SD创建虚拟数字人 使用SD创建虚拟数字人 其他数字人工具: ● Heygen : https://www.heygen.com/ ● d-id:https://studio.d-id.com/ 前段时...
-
VC谈2024年AI发展趋势年:多模态模型主导、GPU短缺等
随着2023年的结束,VC们对过去一年围绕人工智能的巨大进展和伦理辩论进行了回顾。像Bing Chat和Google Bard这样的聊天机器人展示了令人印象深刻的自然语言能力,而生成式AI模型如DALL-E3和MidJourney V6则以其创造性的图像生...
-
阿里发布《AIGC治理与实践白皮书》AI发展需要“防火墙+天花板”
12月27日,北京举行的AI发展与治理创新研讨会成为全球科技关注的焦点。在会上,阿里巴巴集团携手中国电子技术标准化研究院共同发布了《AIGC治理与实践白皮书》,标志着中国在人工智能治理领域取得了新的重要进展。 阿里巴巴科技伦理治理委员会负责人在发布会上表示...
-
网易有道将在1月3日发布子曰教育大模型创新成果
网易有道宣布,将在2024年1月3日,有道「子曰」教育大模型创新成果发布会将在北京举行。 这是继5个月前推出教育大模型「子曰」及六大应用成果之后的一次更新和进展。 在这段时间里,「子曰」教育大模型通过了算法备案与双新评估,成为国家备案的首批教育大模型。其...
-
嵌入和矢量数据库实操指南
译者 | 布加迪 审校 | 重楼 这场革命的核心是矢量数据库概念,这一突破性发展正在重塑我们处理复杂数据的方式。与传统的关系数据库不同,这种数据库具有管理和处理高维矢量数据的独特功能,这种数据是许多AI 和机器学习应用所固有的。随着我们更深入研究先进AI...
-
Stable-diffusion-webui本地部署和简要介绍
Stable Diffusion 是一款基于人工智能技术开发的绘画软件,它可以帮助艺术家和设计师快速创建高品质的数字艺术作品。是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,同时也可以应用于其他任务,如内补绘制、外补...
-
ChatGPT | Bing | Google Bard | 讯飞星火 | 到底哪家强?实测
最近AIGC战场依然热闹,微软的new bing、Google的Bard、国内的讯飞星火认知大模型,都接连上阵,我们对比ChatGPT一起来看看,我把实际使用测试结果发出,供大家参考。有些测试结果可能会出乎大家的预料哦… 今天我们暂时主要比拼4个能力:...
-
足不出户拍冬日写真 抖音AI特效上大分
“张万森,下雪了。”这句话成为了抖音上的新流行语。在雪天来临的时候,许多美女们纷纷发布了他们的冬日雪景写真照,然而这些照片其实是通过AI生成的。 这些照片其实是使用了剪映的AI特效功能,该功能允许用户免费使用6次,并且提供了多种风格模板,只需添加图片即...
-
OPPO首款端侧70亿AI大模型手机 Find X7系列将发布
OPPO今天在Find X7系列技术沟通会上,正式发布了首个AI大模型安第斯大模型AndesGPT。 AndesGPT是一个功能全面、强大的生成式视觉模型,能够对图像进行精准语义理解,并支持超过120类主体的识别与分割。其分割精度高至发丝级,最多可支持6...
-
马斯克称完全由AI制作的电影将在明年出现
据国内媒体报道,特斯拉CEO埃隆·马斯克最近在社交媒体上表示,全部由AI制作的电影有望在明年出现。 有网友分享了一部AI生成的迷你剧,剧中描述一只猴子在一个神秘洞穴里绘制蓝图并建造一艘球形宇宙飞船,画面栩栩如生。马斯克在帖子下方评论称:“AI电影明年就会出...
-
文心一言 VS 讯飞星火 VS chatgpt (60)-- 算法导论6.4 4题
文心一言 VS 讯飞星火 VS chatgpt (60)-- 算法导论6.4 4题 四、证明:在最坏情况下,HEAPSORT 的时间复杂度是Ω (nlgn 。 文心一言: 要证明在最坏情况下,HEAPSORT 的时间复杂度是 Ω(n log n ...
-
2024年我期待的五个AI故事
在OpenAI于2022年11月发布ChatGPT之后,我喜欢称之为AI新闻的持续“海啸”,我不必等待很长时间:从GPT-4和欧盟AI法案到AI搜索之战,开放与封闭AI之争,以及对训练数据和计算能力的渴望,我多次写下了所有这些话题。 现在,距离新年只有...
-
AI换脸视频工具Icons8 FaceSwapper 无需Photoshop就能完美换脸
Icons8FaceSwapper 是一款颇具突破性的免费人工智能工具,旨在简化面部交换过程。这个应用程序为用户提供了与任何选定的个人,无论是名人、朋友还是家人,进行面孔交换的机会。 体验地址:https://icons8.com/swapper 这一创...
-
让AIGC成为你的智能外脑,助力你的工作和生活
人工智能成为智能外脑 在当前的科技浪潮中,人工智能技术正在以前所未有的速度改变着我们的生活和工作方式。其中,AIGC技术以其强大的潜力和广泛的应用前景,正在引领着这场革命。 AIGC技术是一种基于人工智能的生成式技术,它可以通过学习和模仿,生成新的...
-
小米AI创作软件“小米创作”著作权获批登记
天眼查App显示,12月14日,北京小米移动软件有限公司“基于AI算法的小米创作应用系统软件”著作权获得登记批准,软件简称为“小米创作”,版本号为V1.0。 据悉,小米创作 app 是一款小米官方推出的创作类软件,该软件提供了书写和绘画功能,用户可以自由...
-
人工智能如何改变视频监控行业
通过将视频数据与其他信息源相结合,最新的人工智能解决方案不仅可以识别物体和事件,还可以理解复杂的人类行为和交互。其结果是一次巨大的飞跃,从被动观察的工具到主动、智能行动的工具。 实时监控数十个摄像头场景对于人类来说是一项繁琐且疲惫的任务。仅靠人类操作员...
-
llama.cpp Mac版本llama
骆驼.cpp 路线图/宣言/ ggml 纯C/C++中LLaMA模型的推理 热点话题: 简单的网络聊天示例:#1998 k-quants 现在支持 64 的超级块大小 super-block size of 64::#2001 新...
-
【 Bard vs. GPT-4 】ClickHouse 是一款优秀的OLAP大数据引擎,针对 ClickHouse 提出5个问题,并给出参考答案。
【 Bard vs. GPT-4 】ClickHouse 是一款优秀的OLAP大数据引擎,针对 ClickHouse 提出5个问题,并给出参考答案。 3000字。 目录...
-
秒懂AI-深度学习四种常用激活函数:Sigmoid、Tanh、ReLU和Softmax
深度学习中的激活函数是神经网络中至关重要的组成部分,它们为神经网络引入非线性特性,使其能够更好地学习和模拟复杂的输入输出关系。激活函数的选择和使用对于神经网络的性能和训练效果具有重要影响。 本文将介绍四种常用的激活函数:Sigmoid、Tanh、ReLU...