-
OpenAI大动作:Whisper large-v3重塑语音识别技术
在最近的OpenAI首届开发者大会上,一个引人注目的技术亮点是Whisper large-v3的发布。这款最新的自动语音识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。今天,我们就来深入了解这个技术突破,并探讨它如...
-
Stable Diffusion WebUI安装ControlNet插件
ControlNet是一种通过添加额外条件来控制扩散模型的神经网络结构。 sd-webui-controlnet下载地址: GitHub - Mikubill/sd-webui-controlnet: WebUI extension for Contr...
-
Stable Diffusion - API和微服务开发
Stable Diffusion 是一种尖端的开源工具,用于从文本生成图像。 Stable Diffusion Web UI 通过 API 和交互式 UI 打开了许多这些功能。 我们将首先介绍如何使用此 API,然后设置一个示例,将其用作隐私保护微服务以从...
-
0基础云服务器部署Stable Diffusion
心动了没有!!! 你还没有安装好stable-diffusion吗?在这里,你只要有一个可以联网的电脑就可以使用它。 有没有小伙伴被自己电脑的配置劝退的呢?或者各种报错不知道怎么解决?去网站上搜索各种报错的解决方案。 图还没见到,电脑快冒烟了!!...
-
AI - stable-diffusion(AI绘画)的搭建与使用
最近 AI 火的一塌糊涂,除了 ChatGPT 以外,AI 绘画领域也有很大的进步,以下几张图片都是 AI 绘制的,你能看出来么? 一、环境搭建 上面的效果图其实是使用了开源的 AI 绘画项目 stable-diffusion 绘制的,这是它的官...
-
文心一言 VS chatgpt (16)-- 算法导论4.1 1~2题
一、当A的所有元素均为负数时,FIND-MAXIMUM-SUBARRAY返回什么? 文心一言: 当A的所有元素均为负数时,FIND-MAXIMUM-SUBARRAY返回-1。 这是因为在二进制中,当所有元素均为负数时,A的每个元素都对应一个负数,...
-
AI绘画你必须要知道5个tag进阶用法
哈喽,大家好,我是阿宅,最近AI绘画也是很火,阿宅这几天也是静下心来好好研究了一下这个东西,确实好用啊,总所周知啊,这些前沿技术一直都是大厂来开拓和引导的,这不已经有消息说,某某大厂已经基于AI做好了一套完整的商业化流程了。 不管是小...
-
大模型幻觉成应用落地难题 最新评测文心一言解决幻觉能力最好
大模型中的幻觉问题 “林黛玉倒拔垂杨柳”、“月球上面有桂树”、“宋江字武松”……相信经常使用大语言模型都会遇到这样“一本正经胡说八道”的情况。这其实是大模型的“幻觉”问题,是大模型行业落地的核心挑战之一。例如幻觉会影响生成内容的可靠性,对于法律、金融、...
-
如何使用AI绘画,AI绘画关键词怎么写
AI 绘画为什么被抵制?最重要的是版权不清晰,从工具角度来看是好事,前提是做好知识版权对应的利益划分,相信未来肯定会有相关政策,但是,现在我们就得先去接受和学习AI绘画,未来迎接政策的落地! 一、AI绘画推荐 首先我们推荐3个排名前三的...
-
AIGC:【LLM(一)】——LoRA微调加速技术
文章目录 一.微调方法 1.1 Instruct微调 1.2 LoRA微调 二.LoRA原理 三.LoRA使用 一.微调方法 Instruct微调和LoRA微调是两种不同的技术。 1.1 Instruct微调 Instr...
-
AI绘画逆着玩火了,敢不敢发自拍看AI如何用文字形容你?
梦晨 发自 凹非寺量子位 | 公众号 QbitAI 笑不活了家人们,最近突然流行起一个新玩法: 给AI发自拍,看AI如何描述你。 比如这位勇敢晒出自拍的纽约大学助理教授,他的笑容在AI看来居然是“兽人式微笑”。 AI还吐槽他胡子...
-
Stable Diffusion控制人物脸部和手的方法
“ 目前Stable Diffusion在人体姿态控制方面已经取得了比较稳定的效果,但是在人脸和手部姿势的控制上还没有很好的解决,经常会出现崩手和崩脸的情况。” 01 — After Detailer解决崩脸的问题 After...
-
AntDB数据库受邀参加第六届上海人工智能大会,分享AIGC时代核心交易系统升级方案
近日,第六届上海人工智能大会春季论坛圆满落幕。大会以“数智互联,瞰见未来”为主题,邀请了来自国内外十余个国家和地区的学术界顶级学者和业内知名企业的技术大咖,探讨人工智能的学术、人才、技术、行业发展痛点。亚信科技AntDB数据库作为数智转型时代的基础软件受邀...
-
LLaMA模型文件 (搬运工)
LLaMA需要进行申请才能获得官方模型权重。 但是申请的审批时间一般都很长。 这里提供现有的huggingface上,第三方上传的一些LLaMA模型文件: LLaMA-7B LLaMA-13B LLaMA-7B-hf LLaMA-13B-hf 这...
-
手把手教你怎么搭建自己的ChatGPT和Midjourney绘图(含源码)
AI程序采用NUXT3+LARAVEL9开发(目前版本V1.1.7) 授权方式:三个顶级域名+两次更换 1.AI智能对话-对接官方和官方反代(markdown输出)PS:采用百度与自用库检测文字 2.AI绘图-根据关键词绘图-增加dreamStudi...
-
重磅!清华最新报告:文心一言超越ChatGPT 3.5
点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 今年国内厂商已发布很多大语言模型,其中最具代表性的产品有:百度的文心一言、阿里巴巴的通义千问、科大讯飞的星火等,最具代表性的开源工作有:ChatGLM、MOSS、Ba...
-
动手做个mini智能助理--数据准备(2)
背景: 这部分会介绍如何准备自己的数据,利用chatgpt的self-instruct的方式批量的生成平行语料对。chatgpt有超强的生成能力,并且chatgpt的生成结果有经过harmless、种族歧视、不和法规的过审过滤。所以我们可以考虑是...
-
AI生成图像竟如此真实了?Stable Diffusion Model本地部署教程
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 ?个人主页:小嗷犬的个人主页 ?个人网站:小嗷犬的技术小站 ?个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 本文目录 图像生成 sta...
-
大模型「幻觉」,看这一篇就够了
大模型“幻觉”,终于有系统综述了! 一口气49页,详细阐述了幻觉定义、分类、导致幻觉的原因,还有检测幻觉、减轻幻觉的方法。 这篇最新综述来自哈工大和华为,一po出就在网上火得不行: 具体来说,文中用一套新的范畴框架来定义模型幻觉,并将其分为事实性幻觉、...
-
亚马逊Alexa部门面临裁员 公司将重点发展新形式AI
据公司周五的一份内部备忘录透露,亚马逊将裁减数百个Alexa部门的职位,这是公司进行更大范围业务重组的一部分,未来将更专注于开发新形式的人工智能技术。 备忘录显示,此举是为了最大限度地利用公司在生成式人工智能方面的资源和努力。裁员将导致Alexa和Fire...
-
OpenAI爆发人事地震 CEO萨姆·奥特曼被董事会罢免
全球知名的人工智能公司OpenAI最近发生了领导层人事地震。11月17日,OpenAI在官网发布新闻稿宣布,由于公司董事会对现任CEO萨姆·奥特曼的领导能力失去信心,决定将其罢免,首席技术官米拉·穆拉蒂将暂时担任CEO一职。 据悉,OpenAI董事会经过...
-
230页长文,涵盖5大科学领域,微软团队使用GPT-4探索LLM对科学发现的影响
前不久,微软 DeepSpeed 团队启动了一个名为 DeepSpeed4Science 的新计划,旨在通过 AI 系统优化技术实现科学发现。 11 月 13 日,微软团队在 arXiv 预印平台发表题为《大型语言模型对科学发现的影响:使用 GPT-4...
-
写作AI软件哪个好用?安利三个AI写作生成器
曾经,写作是一项需要长时间学习和不断磨练的技能。但如今,随着写作AI软件的出现,任何人都可以轻松地创造出优秀的文章。这些软件通过深度学习算法和自然语言处理技术,将人工智能与写作完美结合,让写作变得更加简单高效。那你们知道写作AI软件哪个好用吗?下面...
-
文心一言 内测体验
文心一言 申请内测 弱智吧经典问题 陨石为什么每次都能精准砸到陨石坑? 我想配个6000多的电脑,大概要多少钱? 为什么我爸妈结婚的时候没邀请我参加婚礼? 我买了一斤藕,为什么半斤都是空的? 我应该怎么称呼女朋友的老公 写一篇报告,关于:吃蔬...
-
chatgpt平替,清华chatglm本地化部署教程(aigc大模型风口,校招找工作必备),包含weiui部署,api部署,对话框部署
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。...
-
【CVHub】《万字长文带你解读AIGC》系列之入门篇
本文来源“CVHub”公众号,侵权删,干货满满。 作者丨派派星 来源丨CVHub 原文链接:《万字长文带你解读AIGC》系列之入门篇 0. 导读 图0 随着ChatGPT的病毒式传播,生成式人工智能(AIGC, a.k.a AI-gener...
-
ai绘画壁纸怎么弄?下面分享三个ai自动生成图片的方法
其实每个创作者在创作过程中难免都会遇到灵感缺失的情况,这个时候其实可以借助一些ai绘画软件! 它可以自动生成风格各异的高质量作品,能有效的激发创作者们的创作灵感,更好的帮助他们突破创作瓶颈。 什么?你问我ai绘画软件是不是只适合有绘画基础的人使...
-
对标ChatGPT:百度大语言模型 文心一言发布
看了发布会,总体而言感觉中规中矩,当然也显示了一些不错的能力,例如能够生成图片、视频,这是OpenAI目前没有开放的功能,百度给整合了,挺好的。但视频生成功能目前没开放体验,因为运算量太大。 很遗憾,目前体验只能通过邀请码注册。 企业版...
-
Stable Diffusion2.0实验室Linux服务器详细运行教程
最近在学习ai共创,在官方网站dreamstdio玩了几次发现需要收费,于是决定部署一个在服务器上。将部署的过程和遇到的问题记录下来供大家参考。 目录 1. 工具准备 2. 下载代码和模型 3. 环境准备 4. 运行代码 1....
-
运行Whisper笔记(1)
最近chatGPT很火,就去逛了一下openai的github项目。发现了这个项目。 这个项目可以识别视频中的音频,转换出字幕。 带着一颗好奇的心就尝试自己去部署玩一玩 跟着这篇文章一步步来进行安装,并且跟着这篇文章解决途中遇到的问题。 途中还会遇到几个...
-
分享50个AI绘画prompt的关键词,让你的AI绘画更贴近想法
我们在使用AI绘画工具时,最关键的就是prompt,但是我们不能总是拾人牙慧,总是用别人写出的现成的prompt,那样的话,最终画出来的画,也是别人画出来的,并不能完全生成自己想要的效果。所以,我们需要学习编写prompt的技巧,了解prompt中的关键词...
-
Stable Diffusion 准确绘制人物动作及手脚细节(需ControlNet扩展)
目前AI绘图还是比较像开盲盒,虽然能根据语义提供惊艳的图片,但是与设计师所构思的目标还是有一定距离。 那像我们这种没有绘画功底的程序员想要制作出心中的人物(尤其手脚)姿态,该怎样减少随机开盒的次数呢? 本文提供几种精确控制人物动作的方法。 安装及其问...
-
AI视野:ChatGPT测试新功能“从聊天中学习”;Kimi Chat全面开放服务;文心生物计算大模型宣布升级;Meta发布AI视频编辑工具Emu Video;贾跃亭也开始搞AI了
???AI新鲜事 ChatGPT测试新功能“从聊天中学习” ChatGPT测试新功能,能学习用户历史聊天、理解偏好,还支持重置记忆和阅后即焚功能,使其更像个性化的朋友。 【AiBase提要:】 ? 学习历史聊天: ChatGPT将能够在一个新的“My C...
-
微软两款自研 AI 芯片 Maia 100 和 CobAlt 将由台积电代工:采用 5 纳米制程技术
据 DIGITIMES 消息,在本周三的 Ignite 开发者大会上,微软发布了两款自主研发的人工智能(AI)芯片:Maia 100 和 CobAlt。这两款芯片由台积电代工,采用 5 纳米制程技术,预计将于明年投入微软 Azure 数据中心,提升包括 O...
-
GPT-4 Turbo问世,API更划算,128K上下文窗口引领新时代
一、简介 在发布GPT-4(点击了解GPT-4)仅仅八个月后,OpenAI推出了更新的模型GPT-4 Turbo,该模型具有可以在一次提示中容纳300页书的上下文窗口,并且提供更便宜的API访问。 【GPT-4 Turbo】:https://openai...
-
AI绘画 | stable-diffusion-ui 下载和安装
简介 Stable Diffusion Web UI是一款基于Stable Diffusion基础应用的交互程序,它利用gradio模块搭建而成。这个模块除了具有txt2img、img2img等基本功能外,还包含许多模型融合改进、图片质量修复等附加升级...
-
数画-AI绘画-免费的人工智能AI绘画网站
文章目录 AIGC 什么是AI作画? Prompt 数画 AIGC的未来发展 结语 AIGC AIGC(AI Generated Content)是指利用人工智能生成内容。是利用人工智能来生成你所需要的内容,GC的意思是创作内容...
-
2023年最值得关注的软件测试行业趋势与发展分析
2023年对于软件测试行业来说,是一个充满变化和机遇的一年,随着软件行业的飞速发展,软件测试也不断进化,以满足日益复杂化的需求。尤其在人工智能、大模型的推动下,软件测试行业正经历着前所未有的挑战和发展。 首先,自动化测试的普及和迅猛发展,成为今年的一...
-
ChatGPT被曝测试新功能:学习所有历史聊天,还能重置记忆、“阅后即焚”
ChatGPT可能要上新一项重大功能了。 那就是记住你之前的聊天内容并不断从中学习(并非单纯保存历史记录),从而了解你的偏好和信息,用于在日后聊天派上用场。 比如你可以给它下达一句“始终用python写代码”的命令,那么之后你再让它写的所有代码都是这...
-
FFA 2023|第六届 Flink Forward Asia 峰会议程正式上线!
今年 Flink Forward Asia(以下简称 FFA ) 重新回归线下,将于 12 月 8 - 9 日在北京望京凯悦酒店举办。Flink Forward Asia 2023 大会议程现已正式上线! Flink Forward 是由 Apache...
-
GPT-4V新玩法登顶GitHub热榜,随手一画就能生成网页!Web开发者:感受到了威胁
随手一画就能生成网页!GPT-4V新玩法登顶GitHub热榜,狂揽3000+?: 现在只要简单画一画,框一框,点击执行: “啪”地一下,一个带有各种“按钮”的网页就做好了: 对应代码也一览无余: 整个操作过程十分快捷简单。 新玩法不只在GitH...
-
高通推出第三代骁龙7处理器 AI性能提升90%
高通宣布推出第三代骁龙7移动平台,第三代骁龙7移动平台采用了全新的CPU架构,最高主频高达2.63GHz,采用64位架构,CPU整体性能提升近15%,GPU性能提升超过50%。同时,第三代骁龙7移动平台整体功耗降低20%,并带来更持久的续航。 在AI方面...
-
【stable-diffusion使用扩展+插件和模型资源(上】
文章目录 前言 一、插件推荐 1.qrcode-monster 2.sd-webui-openpose-editor 3.sd-webui-depth-lib 4.roop(换脸插件) 5.sd-webui-qrcode-toolkit(艺术...
-
大语言模型量化方法对比:GPTQ、GGUF、AWQ
在过去的一年里,大型语言模型(llm 有了飞速的发展,在本文中,我们将探讨几种(量化 的方式,除此以外,还会介绍分片及不同的保存和压缩策略。 说明:每次加载LLM示例后,建议清除缓存,以防止出现OutOfMemory错误。 del model, tok...
-
AI原型“Make It Real”震惊开发者,将草图转化为可运行软件
在本周三,一款名为"tldraw"的协作白板应用发布了一项名为"Make It Real"的功能原型,引起了开发者社区的热议。该功能利用OpenAI的GPT-4V API,将用户绘制的矢量图转化为可运行的Tailwind CSS和JavaScript we...
-
微软战略大转变:拥抱小模型!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 微软的生成式AI战略似乎出现了180度大转变:相比大模型,小模型才是微软的真爱。 在Ignite 2023上,微软董事长兼首席执行官Nadella在主题演讲中表示:“微软喜欢小模型...
-
Google DeepMind推AI音乐生成模型Lyria:用AI将文本转化为独特音乐作品
Google DeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。这一创新是谷歌旗下视频分享平台YouTube的新功能的一部分,旨在让用户能够轻松生成自己的音乐作品。 Lyria的设...
-
AI绘画热点模型大汇总,让你一次用个够
AI绘画热点模型大汇总,让你一次用个够 前段时间,在利用ControlNet重新定义你的AI姿势中提到了如何利用快捷方式节省谷歌硬盘,由于目前收集到的模型站点涉及的模型较少,且缺少lora模型。因此寻思着自己是不是也可以做一些热点模型的站点出来分享给大...
-
AI开源项目screenshot-to-code 借助GPT-4V直接把网页截图制作成HTML网页
这是一个简单的应用程序,可将截图转换为HTML/Tailwind CSS。它利用GPT-4Vision生成代码,并使用DALL-E3生成类似的图像。用户只需上传截图,即可获得整洁的前端代码,包括HTML、Tailwind CSS和JavaScript。...
-
微软发布声音克隆技术Personal Voice 提供1分钟样本即可生成AI语音
微软近日发布了一项名为Personal Voice的新技术,该技术可以克隆用户的声音,并且能够复制出与原声音完全一致的人工智能语音。用户只需提供1分钟的语音样本,Personal Voice就能在几秒钟内生成相应的AI语音。 这项技术支持多达100种不同语...