-
ChatGPT提示词新玩法「make it more」,文生图效果翻倍
ChatGPT 想来大家都不陌生了,但如何用好它却没有想象中的那么容易。尤其是在文生图任务中,提示上的一些技巧非常有用。 想要生成一张符合预期的图像,需要在输入提示词上「取巧」。 近日,网络上流行起了 ChatGPT 的「make it more」文生图...
-
Stable Diffusion部署
Stable Diffusion Stable Diffusion简介 硬件配置 部署 采用秋葉大佬的整合包v4 秋葉大佬B站地址 开始安装 启动器设置 Stable Diffusion安装结束 Stable Diffusi...
-
Kumo.AI推出全新预测性AI平台 引入了类似SQL的预测性查询语言
近年来,技术的快速发展已经改变了企业的业务模式,人工智能成为全球范围内的核心讨论话题。在这一背景下,Kumo.AI宣布推出了一款全新的预测性AI平台,引入了类似SQL的预测性查询语言。相较于生成式AI,预测性AI更专注于基于当前数据预测未来趋势,能够处理更...
-
人工智能会取代视觉特效师的角色吗?
人工智能在视觉效果(VFX 领域的集成是一种变革力量,通过引入无缝和数据驱动的方法,彻底改变了传统的工作流程。 人工智能和视觉特效之间的这种协同作用不仅简化了整个制作流程,而且提高了视觉特效师的创作能力。 自《终结者》和《黑客帝国》等经典电影以来,视觉...
-
FlashOcc:占用预测新思路,精度、效率和内存占用新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin 论文链接:https...
-
【Bard】针对程序员的专业ChatGpt
【Bard】让程序员工作更加智能、高效 继GPT-4发布一周后,谷歌推出了聊天机器人即Bard,我并未参加谷歌的内测,但我对 Bard 的推出和 AI 技术的发展表示欣喜和期待。Bard 是一款面向程序员的聊天机器人,与 ChatGPT...
-
AWS CodeWhisperer产品初体验
CodeWhisperer 简介 CodeWhisperer 是亚⻢逊出品的一款基于机器学习的通用代码生成器,可实时提供代码建议。 在编写代码时,它会自动根据我们现有的代码和注释生成建议。 从单行代码建议到完整的函数,它可为我们提供各种大小和范围的个性...
-
【Stable Diffusion】基本概念之hypernetwork
1.基本概念 hypernetwork,中文名为超网络,是一种神经网络架构,它允许动态生成神经网络的参数(权重 。简而言之,hypernetwork可以生成其他神经网络。 在Stable Diffusion中,hypernetwork被用于动态生成分类器的...
-
安装stable-diffusion时gfpgan安装失败
错误代码如下: Installing gfpgan Traceback (most recent call last : File "launch.py", line 380, in <module> prepare_enviro...
-
【城南】如何识别AI生成图?视觉AIGC伪造检测技术综述
图片无法加载可参考阅读:知乎文章 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ry2Qw8uO-1685675351028 (https://r3mu87a8e6.feishu.cn/space/api/box/stre...
-
景联文科技:一文读懂火爆全网的AIGC和背后的数据标注技术!
“在过去的几个月中,AIGC发展速度惊人,DALL-E、Midjourney和Stable Diffusion等技术的快速发展,创作出了许多由AI生成的艺术品。本文中,我们将为您阐述AIGC技术和背后所涉及的数据标注技术。" 今年八月,美国的一位39...
-
C#使用whisper.net实现语音识别(语音转文本)
目录 介绍 效果 输出信息 项目 代码 下载 介绍 github地址:https://github.com/sandrohanea/whisper.net Whisper.net. Speech to text made simpl...
-
【Kaggle】Stable Diffusion 竞赛(2023 年 5 月 11 日版本,准确率 0.59 + )
一、第一部分讲解 !mkdir -p /kaggle/images/ from PIL import Image from pathlib import Path images = list(Path('/kaggle/input/stable-di...
-
谷歌和微软联手培养AI未来:推出面向初学者的入门课程
近期,谷歌和微软联手推动人工智能(AI)领域的军备竞赛迈向教育行业,分别发布了针对初学者的AI入门课程。这标志着人工智能不仅仅是科技领域的竞争,也成为培养下一代科学家、思想家和AI领袖的教育重点。 首先,谷歌携手Raspberry Pi基金会推出了名为「E...
-
IDEA提出ToG思维图谱 大模型性能提升214%!
近期,由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术,在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型(LLM)与知识图谱(KG ,成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。...
-
经典表情包原来还有这“续集”!Stable Video创意玩法火了
用AI把经典表情包升级为视频,这种创意玩法最近属实是有点火。 比如那张最经典的“男人扭头看红裙女子”,现在是这样婶儿的: 最绝的还是它的续集: 男人被发现了,狼狈转头,甚至是他的老婆也很尴尬(狗头) 有人看完当即拍大腿: 这么多年了,终于知道这对co...
-
分享10款免费好用的AI写作工具
随着人工智能技术的不断发展,越来越多的AI写作工具涌现出来,为创作者们提供了便捷的写作体验。无论是商业文案、创意写作还是学术论文,这些免费好用的AI写作工具都能为您的创作过程带来帮助。以下是10款值得一试的免费AI写作工具,附带它们的网址,方便您快速体验:...
-
单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法
2D 扩散模型极大地简化了图像内容的创作流程,2D 设计行业也因此发生了变革。近来,扩散模型已扩展到 3D 创作领域,减少了应用程序(如 VR、AR、机器人技术和游戏等)中的人工成本。有许多研究已经对使用预训练的 2D 扩散模型,生成具有评分蒸馏采样(S...
-
南洋理工推80亿参数多模态大模型OtterHD
最近,南洋理工华人团队提出的80亿参数多模态大模型 OtterHD 引起了人们的关注。与其他模型相比,OtterHD 具有处理高分辨率图像的能力,并且具有通用性,能够应对各种推理需求。团队通过在 Fuyu-8B 上进行指令微调,并使用 FlashAtten...
-
Wow官网体验入口 美团AI聊天软件免费app下载
《Wow》是一款面向年轻人的AI朋友社区应用。在这个平台上,用户可以随时随地进入各种幻想世界,与AI伙伴进行角色扮演,实现心中的一切想象。这个应用利用了先进的AI技术,提供拟人化对话、精美的人物形象和高度拟人化的声音合成等功能。那么,《Wow》在哪里可以体...
-
如何利用人工智能挖掘会话式客户体验的潜力
企业可以依靠人工智能工具来部署对话式客户体验计划,从而积极影响客户忠诚度并增加利润。 支持人工智能的虚拟助理已成为塑造现代客户体验(CX 的变革力量。这些技术工具重新定义了客户期望和交互的格局,并为所谓的会话式客户体验奠定了基础。对话式客户体验的范围广...
-
使用stable diffusion生成图片
准备 硬件:有GPU的主机,显存6G+ 系统:windows10 或者 ubuntu 20.04 软件: anaconda 1.下载安装anaconda wget https://repo.anaconda.com/a...
-
网络规模、训练学习速度提升,清华团队在大规模光电智能计算方向取得进展
随着大模型等人工智能技术的突破与发展,算法复杂度剧增,对传统计算芯片带来了算力和功耗的双重挑战。近年来,以光计算为基础、通过光电融合的方式构建光电神经网络的计算处理方法已经成为国际热点研究问题,有望实现计算性能的颠覆性提升。 然而,光电神经网络的前向数学...
-
超级AI不会主宰人类,但人工智能必须开源!LeCun最新采访引全网300万人围观
LeCun一段近5分的视频,引起了全网300+万人的关注。 视频中,他再次重提对开源人工智能的几点看法: - 未来将出现超越人类智能的人工智能 - 这些人工智能将受到我们的控制 - 它们不会成为我们的主宰,也不会对我们构成威胁 - 它们将成为我们与数字...
-
LeCun:超级AI不会主宰人类,但必须开源
人工智能领域的重要人物之一,LeCun在最新访谈中再次表达了他对开源人工智能的坚定看法。他强调了未来可能出现超越人类智能的情景,但同时指出这些人工智能不会成为人类的主宰。相反,它们将充当与数字世界互动的中介,为人类提供帮助。LeCun认为,为了确保这些人工...
-
Inflection推Inflection-2:号称全球计算级别最佳AI模型及全球第二最强大LLM
Inflection AI最近推出的语言模型Inflection-2,被宣称为全球计算级别最佳的AI模型,位列全球第二最强大的大型语言模型(LLM),仅次于OpenAI的最新模型。这一创新的AI模型的开发是为了满足对能够在各种任务中理解和生成类似人类文本的...
-
(三)SadTalker 让stable diffusion 人物可以说话
功能说明 github 项目SadTalker 可以根据一张图片、一段音频,合成面部说这段语音的视频。图片需要真人或者接近真人。目前项目已经支持stable diffusion webui,可以SD出图后,结合一段音频合成面部说话的视频(抖音常见的数字...
-
openai的whisper语音识别介绍
openAI发布了chatgpt,光环一时无两。但是openAI不止有这一个项目,它的其他项目也非常值得我们去研究学习。 今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了...
-
Stable-Diffusion-WebUI从代码下载到使用技巧
一、写在前面 本文用于对AI绘画感兴趣但无计算机编程基础的人,包含本人安装和使用过程中的心得,可供新学者参考。 心理准备: 电脑性能越高越好,最好有高端显卡,如30系以上。低端显卡也可以,速度和质量感人就是; 会要求下载一些软件、模型,涉及环境变...
-
ChatGPT vs AutoGPT:比较顶级语言模型
理解 ChatGPT 由 OpenAI 开发的 ChatGPT 是一种语言模型,旨在根据接收到的输入生成类似于人类的文本。它使用一种称为 Transformer 的机器学习技术,使其能够生成连贯且与上下文相关的响应。 ChatGPT 的一个关键功能是它能...
-
OpenAI内乱之害远未止
继OpenAI最近的争议后,AI工程师和公司开始减少乃至完全摆脱对其API的依赖。 译自Pivot! AI Devs Move to Switch LLMs, Reduce OpenAI Dependency,作者 Richard MacManus 是...
-
Xboard:一款基于ChatGPT的智能键盘
Xboard是一款基于人工智能技术的先进键盘,旨在帮助用户实现更智能、更迅速、更高效的消息、电子邮件、内容和搜索生成。 该键盘充分利用人工智能技术,能够自动生成多种类型的消息、电子邮件、内容和搜索,从而显著提高用户的生产力和工作效率。不仅如此,它还能根据用...
-
OpenAI开源语音识别模型Whisper在Windows系统的安装详细过程
文章目录 1、安装Python 2、安装FFmpeg 2.1、配置环境变量 3、安装显卡驱动 3.1、安装CUDA 4、安装PyTorch 5、安装whisper 6、whisper的使用 7、总结 8、源码下载 9、视频教程 1、...
-
GPTs 初体验 - 1 分钟就能创建一个自己的 ChatGPT? | 京东云技术团队
就在 11.10 号早上,ChatGPT 已经偷摸的把 GPTs 功能,开放给所有尊贵的 Plus 用户了。 随着这波的功能开放,界面也是改了不少。点击左侧的 Explore 或者左下角的用户处,就可以直接进入新的 GPTs 功能: 这里可以看到我...
-
Stable Diffusion + EbSynth + ControlNet 解决生成视频闪烁
一、安装 1.1、安装ffmpeg 下载地址: 解压,配置环境变量 E:\AI\ffmpeg\bin 检查是否安装成功 1.2、安装SD的 EbSynth 插件 插件地址 https://github.com/s9roll7/ebsynth_...
-
面对AMD英特尔微软谷歌的挑战,英伟达AI计算能否笑到最后?
几天前英伟达发布财报,业绩不错,但不够好,无法推动股价进一步爬升。尽管如此,英伟达已经向投资者证明,竞争对手AMD、英特尔想追上还有很长的路要走。 英伟达高管知道竞争很激烈,他们强调,在AI芯片领域英伟达地位超然。如何保持优势?英伟达会加快研发速度,每...
-
谷歌Colab云端部署Stable Diffusion 进行绘图
系列文章目录 本地部署Stable Diffusion教程,亲测可以安装成功 Stable Diffusion界面参数及模型使用 文章目录 系列文章目录 前言 一、Colab是什么? 二、操作步骤 1.找到对应的脚本 2.在谷歌...
-
Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享
OVD技术简介 目标检测是计算机视觉领域中的一项核心任务,其主要目标是让计算机能够自动识别图片中目标的类别,并准确标示每个目标的位置。目前,主流的目标检测方法主要针对闭集目标的开发,即在任务开始之前需要对待检测目标进行类别定义,并进行人工数据标注,通...
-
微调stable diffusion哪个部分才是最有效的?
Diffusion Models专栏文章汇总:入门与实战 前言:最近一直在做stable diffusion微调方面的研究, 因为stable diffusion模型非常大,一个非常关键的问题是微调哪个部分才是最有效的?是微调unet吗?是微...
-
Photoshop安装StableDiffusion插件安装使用教程解决面临高峰需求问题
插件介绍 借助 Auto-Photoshop-StableDiffusion-Plugin,您可以直接在 Photoshop 中使用 Automatic1111 Stable Diffusion 的功能,而无需在程序之间切换。这使您可以在熟悉的环境中轻松...
-
本地运行 LLAMA & GPT-3.5-TURBO开源项目
git: nomic-ai/gpt4all: gpt4all: an ecosystem of open-source chatbots trained on a massive collections of clean assistant data i...
-
【AI绘图】Stable Diffusion WebUI环境搭建
Stable Diffusion WebUI开源地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui 首先根据要求做以下准备工作: 1. 安装 Python 3.10.6, 安装时记得勾...
-
微软的人工智能 Copilot 到底有多强大?带你来体验一下
本文同步发表于我的微信公众号,扫一扫文章底部的二维码或在微信搜索 郭霖 即可关注,每个工作日都有文章更新。 说实话,这是一篇我早就应该写的文章,我也不知道为什么我能拖这么久。 但好像从来也没有读者朋友们催我写过这类文章,这为我的拖更提供了很好的理由...
-
南开&山大&北理工团队开发trRosettaRNA:利用Transformer网络自动预测RNA 3D结构
RNA 3D 结构预测是一个长期存在的挑战。 受最近蛋白质结构预测领域突破的启发,南开大学、山东大学以及北京理工大学的研究团队开发了 trRosettaRNA,这是一种基于深度学习的自动化 RNA 3D 结构预测方法。 trRosettaRNA 流程包括...
-
自驱力超强的羊驼?斯坦福微调LLaMa
大型“指令调优”语言模型在新任务上展现了Zero-shot的卓越能力,但严重依赖于人类编写的指令数据,而这些数据在数量、多样性和创造性方面都是有限的。 斯坦福科研人员引入了self-instruction框架,提高指令遵循能力来自我迭代进化,与Instr...
-
Stable Diffusion 模型界面介绍
Stable Diffusion 模型界面介绍 界面1 图1 Stable Diffusion 模型界面1 ①:选择的模型,及Stable Diffusion进行生成图片是使用的模型。其中.ckpt为大模型 ②:prompt --&g...
-
用python对文心一言进行交互
要使用Python与文心一言进行交互,您需要使用Python的请求库(如requests)来发送请求并接收响应。 以下是一个简单的示例代码,演示如何使用Python与文心一言进行交互: import requests def query_we...
-
AI绘图学习心得分享-Midjourney绘画AI,让你少走一些弯路
本教程收集于:AIGC从入门到精通教程 AI绘图学习心得分享-Midjourney绘画AI,让你少走一些弯路 本篇没有什么长篇大论,全部都是实用心得总结。接下来,我们将分享关于Midjourney绘画AI的实用心得总结,包括构图指令结构、常用指令、操作...
-
与AIGC的快乐游戏: Prompt提示词的重要性
你好,亲爱的读者们!我是你们的老朋友小W,致力于探索和分享一切有关人工智能的话题。今天,我想带你走进一个全新的领域——玩转AIGC(Artificial Intelligence Generated Content),并告诉你一个重要的秘密:Prompt提...
-
三分钟快速构建大语言模型AI知识库
FastGPT FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景! 知识库核心流程图 图片 图片来源:https://doc.fa...