-
人工智能会取代视觉特效师的角色吗?
人工智能在视觉效果(VFX 领域的集成是一种变革力量,通过引入无缝和数据驱动的方法,彻底改变了传统的工作流程。 人工智能和视觉特效之间的这种协同作用不仅简化了整个制作流程,而且提高了视觉特效师的创作能力。 自《终结者》和《黑客帝国》等经典电影以来,视觉...
-
欧洲初创公司Cradle融资2.4亿美元融资,助力科学家通过AI设计蛋白质
欧洲生物科技初创公司Cradle近日成功筹集2400万美元,旨在利用人工智能(AI)协助科学家更快、更经济地设计和工程化蛋白质。这家总部位于荷兰代尔夫特和瑞士苏黎世的公司成立于2021年,其生成式人工智能(Generative AI 技术在生物制药领域引起...
-
TS版LangChain实战:基于文档的增强检索(RAG) | 京东云技术团队
LangChain LangChain是一个以 LLM (大语言模型)模型为核心的开发框架,LangChain的主要特性: 可以连接多种数据源,比如网页链接、本地PDF文件、向量数据库等 允许语言模型与其环境交互 封装了Model I/O(输...
-
使用openai-whisper 语音转文字
前言: 最近由于ChatGPT 的大热,AI 应用领域再次进入大众的视线,今天介绍一款AI应用whisper 可以较为准确的将人声转换为文字(支持多国语言) 一、安装 安装有两种方式pip 和源码编译安装,这里介绍pip安装方式...
-
FlashOcc:占用预测新思路,精度、效率和内存占用新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin 论文链接:https...
-
Cradle的AI蛋白质编程平台获得2400万美元融资
近日,生物技术和人工智能初创公司Cradle成功融资2,400万美元,成就了其基于生成式方法的蛋白质设计平台。该公司在超过一年前走出隐匿状态,正值大型语言模型热潮兴起之际。与其他生物技术公司训练模型以本地理解分子结构不同,Cradle的独到之处在于将构成人...
-
AIGC Stable Diffusion WebUI windows安装指南
安装电脑配置要求: NVIDIA显卡 显存>=4G(越大越好) 安装需要软件: git python cuda stable-diffusion-webui 梯子(魔法上网) 安装步骤: git安装 下载地...
-
自带 AI 生图,微软现已为 Windows 11 画图 App 引入 DALL-E 3 集成
IT之家 11 月 28 日消息,微软现已开始向所有 Windows 11 用户推送集成 DALL-E 3 的“画图”应用。 IT之家注:DALL-E 模型是 OpenAI 开发的图片生成模型,此前已在微软 Bing 的图像生成功能中使用。 得益于 D...
-
尴尬!《体育画报》被曝刊登虚假AI作者文章
近日,有报道指出《体育画报》涉嫌刊登虚假AI作者的文章,揭露了包括“Drew Ortiz”和“Sora Tanaka”在内的虚构作者。据Futurism报道,这些作者的头像被发现在一个由AI生成的图像网站上售卖,有知情人士透露,还有许多类似的虚假作者。Th...
-
AI篇-chatgpt基本用法(文心一言也适用)
目录 (1)基本规则 (2)例子1-文章摘要 (3)例子2-代码生成 (4)文心一言链接 (1)基本规则 相比于搜索引擎,ChatGPT的优势在于其高效的想法关联和信息归纳能力。在进一步讲解提示的构建思路前,我希望你可以了解到两点通用的经...
-
在少样本学习中,用SetFit进行文本分类
译者 | 陈峻 审校 | 重楼 在本文中,我将向您介绍“少样本(Few-shot)学习”的相关概念,并重点讨论被广泛应用于文本分类的SetFit方法。 传统的机器学习(ML) 在监督(Supervised)机器学习中,大量数据集被用于模型训练,以便...
-
谷歌搜索无法区分 AI 生成的图片和真实图片,引发对真实内容展示的担忧
在听过 Israel Kamakawiwoʻole 动人心弦的《Somewhere Over The Rainbow》版本后,人们可能会想看看这位体型庞大的歌手长什么样。然而,今天进行这样的搜索,你会看到的是他的 AI 生成版本。 在另一个 AI 图像登...
-
Meta LlaMA 2 最强的AI大语言模型!完全免费开源了!!附最新下载方式
1.Text generation web UI【点击下载】 2.语言模型下载:【官方链接】,普通GPU建议选择Llama-2-7b-chat模型,如果你的GPU比较强,建议选择Llama-2-13b-chat 或者 Llama-2-70b-chat 模...
-
文本引导的图像生成模型一:DALL·E 2
可以参考模型:https://zhuanlan.zhihu.com/p/526438544...
-
字节跳动成立新AI部门Flow 发力AI应用层
据36氪消息,字节跳动近期成立了一个新的AI部门Flow,由技术副总裁洪定坤领导。 据一位知情人士透露,该部门的业务带头人是字节大模型团队的负责人朱文佳。这些信息尚未得到字节跳动的官方回应。 据了解,Flow部门主要关注AI应用领域。 在字节跳动内部,F...
-
Mac book M1/M2 安装 stable diffusion流程(SD)
一、 创建虚拟环境 由于后期炼丹的时候需要很多图片资源,因此如果你的硬盘空间和我一样不是很多的话,我建议你也将环境安装在外接移动硬盘上。 我们在创建虚拟环境时可以使用如下命令来指定虚拟环境安装的位置,同时我们还指定了 Python 的版本。 安装m...
-
GPT-4 VS GPT-3.5!你需要升级plus版本吗?
GPT-4和 GPT-3.5语言模型在前沿技术的推动下,都具备了相当出色的自然语言生成能力。 鉴于GPT-4正式发布的消息已经引发了不小的关注,本文将从完善度测试、推理能力测试、创造力测试三个角度探讨两者的区别和优劣,为您提供实用的指导,帮助您了解是...
-
Stable Diffusion WebUI 各操作系统安装教程
最近几天在 2 台 Mac、2 台 PC、一台云无 GPU 的 Linux 安装了 Stable Diffusion WebUI,这里记录下如何安装,以及一些注意点和坑。 以下内容针对 Windows(N 卡)、MacOS(m 系列芯片)、Linux(U...
-
Stable Diffusion Web-UI 安装指南
Stable DIffusion 是 Stability.AI 开源的 text-to-image 模型,目前类似产品有 Midjourney 以及 OpenAI 的 DELL-2 ;从AI绘画效果上来说,Midjourney 目前公认是最好的;但从模型的...
-
【whisper】在python中调用whisper提取字幕或翻译字幕到文本
最近在做视频处理相关的业务。其中有需要将视频提取字幕的需求,在我们实现过程中分为两步:先将音频分离,然后就用到了whisper来进行语音识别或者翻译。本文将详细介绍一下whisper的基本使用以及在python中调用whisper的两种方式。 一、...
-
Stable Diffusion 无损放大图像和缩小图像
Stable Diffusion默认生成的图片尺寸为512×512,这种尺寸的分辨率可能无法满足高质量的要求。若想生成大图,存在两种可选的方法,在显卡足够支撑的情况下可以将图像当打到8K。 文章目录 hires.fix高分辨率修复 e...
-
diffusers库中stable Diffusion模块的解析
diffusers库中stable Diffusion模块的解析 diffusers中,stable Diffusion v1.5主要由以下几个部分组成 Out[3]: dict_keys(['vae', 'text_encoder', 'token...
-
【Bard】针对程序员的专业ChatGpt
【Bard】让程序员工作更加智能、高效 继GPT-4发布一周后,谷歌推出了聊天机器人即Bard,我并未参加谷歌的内测,但我对 Bard 的推出和 AI 技术的发展表示欣喜和期待。Bard 是一款面向程序员的聊天机器人,与 ChatGPT...
-
AWS CodeWhisperer产品初体验
CodeWhisperer 简介 CodeWhisperer 是亚⻢逊出品的一款基于机器学习的通用代码生成器,可实时提供代码建议。 在编写代码时,它会自动根据我们现有的代码和注释生成建议。 从单行代码建议到完整的函数,它可为我们提供各种大小和范围的个性...
-
Stable Diffusion 丝滑无闪烁AI动画 Temporalkit+Ebsynth+Controlnet
早期的EbSynth制作的AI视频闪烁能闪瞎人的双眼,可以通过【temporalkit+ebsynth+controlnet】让视频变得丝滑不闪烁。 文章目录 插件准备 丝滑视频制作 插件准备 下载安装 EbSynth...
-
【Stable Diffusion】基本概念之hypernetwork
1.基本概念 hypernetwork,中文名为超网络,是一种神经网络架构,它允许动态生成神经网络的参数(权重 。简而言之,hypernetwork可以生成其他神经网络。 在Stable Diffusion中,hypernetwork被用于动态生成分类器的...
-
安装stable-diffusion-webui时一直卡在Installling gfpgan的界面
前言 出现这个问题的原因是,安装gfpgan涉及到国外的仓库,就算科学上网以后,在终端里面还是访问不到这个国外仓库,解决办法就只有手动安装,遇到一些pip安装不了的包都可以尝试去github上找到对应的包仓库进行手动安装。 解决办法:手动安装gfpg...
-
记录安装stable diffusion webui时,出现的gfpgan安装卡住的问题
参考链接:(145条消息 使用stable diffusion webui时,安装gfpgan失败的解决方案(windows下的操作)_新时代原始人的博客-CSDN博客...
-
一周 AIGC 丨马云回国首谈 ChatGPT,AIGC 用于旅游宣传片
图片来源:由无界AI生成 今天,在海外“流浪”近 1 年的马云回国的消息刷屏,被众多媒体解读为是对中国民营企业的一个重大的标志性事件。眼光一向超前的马云自然不会错过 ChatGPT 话题。他说:“ChatGPT 这一类技术已经对教育带...
-
Stable Diffusion - 常用的负向提示 Embeddings 解析与 坐姿 (Sitting) 提示词
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132145248 负向 Embeddings 是用于提高 Stable...
-
QQGC?揭秘QQ的AI绘画大模型技术
?腾小云导读 2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文将介绍在QQGC基础大模型训练中的实践和探索,接着往下看吧~...
-
GitHub Copilot 快速入门
GitHub Copilot 是 AI 结对程序员。 可以使用 GitHub Copilot 在编辑器中获取整行或整个函数的建议。 1. 简介 让我们首先了解一些关于 GitHub Copilot 的内容。 这是 GitHub 和 OpenAI 的合作...
-
在 Windows(NVIDIA 和 AMD)上使用 Stable Diffusion 的快速简便方法,使用 AUTOMATIC1111 稳定的扩散网络 UI 在您自己的计算机上制作免费的 AI 艺术
您可能知道,互联网上有无数网站可用于生成 AI 艺术。Lexica、dreamlike.art、Playground AI、InstantArt或一些 Huggingface 空间是我过去使用的少数几个。 问题是它们中的大多数速度很慢并且只提供基本服务。...
-
安装stable-diffusion时gfpgan安装失败
错误代码如下: Installing gfpgan Traceback (most recent call last : File "launch.py", line 380, in <module> prepare_enviro...
-
【城南】如何识别AI生成图?视觉AIGC伪造检测技术综述
图片无法加载可参考阅读:知乎文章 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ry2Qw8uO-1685675351028 (https://r3mu87a8e6.feishu.cn/space/api/box/stre...
-
景联文科技:一文读懂火爆全网的AIGC和背后的数据标注技术!
“在过去的几个月中,AIGC发展速度惊人,DALL-E、Midjourney和Stable Diffusion等技术的快速发展,创作出了许多由AI生成的艺术品。本文中,我们将为您阐述AIGC技术和背后所涉及的数据标注技术。" 今年八月,美国的一位39...
-
stable diffusion安装问题求教!
最后的webui-user.bat执行的过程真的是痛苦而漫长,网上什么破教程,问题一个接一个,解决一个就跳出另一个! 现在卡在这里了! 求教!如何解决。 Traceback (most recent call last : File "D:\SD...
-
configuration_auto.py in getitem raise KeyError(key) KeyError: ‘llama‘解决方案
大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客...
-
ChatGPT 与 Google Bard:技术差异比较
Introduction 介绍 Artificial Intelligence (AI chatbots are becoming increasingly popular, and two of the most well-known example...
-
Redis内存空间预估与内存优化策略:保障数据安全与性能的架构实践AIGC/AI绘画/chatGPT/SD/MJ
推荐阅读 AI文本 OCR识别最佳实践 AI Gamma一键生成PPT工具直达链接 玩转cloud Studio 在线编码神器 玩转 GPU AI绘画、AI讲话、翻译,GPU点亮AI想象空间 资源分享 「java、pytho...
-
C#使用whisper.net实现语音识别(语音转文本)
目录 介绍 效果 输出信息 项目 代码 下载 介绍 github地址:https://github.com/sandrohanea/whisper.net Whisper.net. Speech to text made simpl...
-
GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理
扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。 为了解决这些问题,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框架...
-
【Kaggle】Stable Diffusion 竞赛(2023 年 5 月 11 日版本,准确率 0.59 + )
一、第一部分讲解 !mkdir -p /kaggle/images/ from PIL import Image from pathlib import Path images = list(Path('/kaggle/input/stable-di...
-
谷歌和微软联手培养AI未来:推出面向初学者的入门课程
近期,谷歌和微软联手推动人工智能(AI)领域的军备竞赛迈向教育行业,分别发布了针对初学者的AI入门课程。这标志着人工智能不仅仅是科技领域的竞争,也成为培养下一代科学家、思想家和AI领袖的教育重点。 首先,谷歌携手Raspberry Pi基金会推出了名为「E...
-
DALLE2论文解读及实现(一)
DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents paper: https://cdn.openai.com/papers/dall-e-2.pdf githu...
-
讯飞智文官网体验入口 AI办公软件哪个好用
讯飞智文是一款人工智能文档创作平台,它由科大讯飞股份有限公司开发和推出。它可以根据用户的输入内容,自动生成高质量的文档,包括文章、PPT、视频等多种格式。它基于讯飞星火认知大模型,支持处理各种内容格式,包括一句话主题、长文本、音视频等多种形式。它不仅可以提...
-
AI绘画|免费开源!一键部署的AI绘画工具Fooocus
一、项目介绍 (一 Fooocus:探索创意的图像生成软件。 该项目发布仅仅一周便在Github上收获了超过6k的star!! 其爆火的背后和Fooocus的三个特点分不开: 发扬了Stable Diffusion的开源精神...
-
IDEA提出ToG思维图谱 大模型性能提升214%!
近期,由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术,在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型(LLM)与知识图谱(KG ,成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。...
-
Midjourney教程(一)——如何使用Midjourney
Midjourney教程——如何使用Midjourney 注册 登陆Midjourney官网https://www.midjourney.com/home/ 注册Discord账号,注册完成后登陆即可 在Midjourney的公共服务器...
-
OpenAI董事会变动只剩男性 福布斯提议十位女性候选人
在OpenAI近期的变动中,董事会经历了巨大的变革,由此形成了一个全白人、全男性的董事会。在这一连串的变动中,原本拥有两名女性董事的OpenAI董事会在不到一个月的时间内变成了全男性成员。 原董事会成员Helen Tomer因与CEO Sam Altman...