-
【Python实用API】语音转文本-whisper
Whisper安装及使用教程 0.Whisper介绍 1.Whisper安装 1.1 依赖库安装 1.2 Whisper安装 2.Whisper使用 2.1 Whisper基本使用(语音识别) 2.2 Whisper进阶使用 2.2.1...
-
Stable diffusion 实现人台图转换模特图详细步骤:(照抄即可实现)
前置条件: ① 默认是配置好环境的,配置环境很简单有很多教学视频,②有基础大模型真实系列的,这个也好解决,网上很多,如果需要我的也可分享③电脑配置较佳 小Tips: 正面图片也可以照抄而且步骤更少,但是如果需要控制人脸...
-
Stable Diffusion WebUI 图生图(img2img):图生图/涂鸦绘制/局部重绘/有色蒙版/上传蒙版/批量处理/反推提示词
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。 大家好,我是水滴~~ 本篇文章我们介绍 Stable Diffusion WebUI 的图生图功能,主要包括:图生图、图生图(手绘修正)/涂鸦绘制、局部重绘、...
-
全球下载量最大的AI绘画大模型,更新Lightning极速版
几个月前,Stable Diffusion的大模型连续推出了两中提速技术,一个是官方的Turbo,一个是清华团队的LCM。 都能在5-8步实现出图效果,把出图时间缩短了5-10倍。 但是,除了Dreamshaper等少数几个大模型坚决跟进外,大部分大模...
-
DBRX抢占开源大模型王座 编程、数学等领域超越GPT-3.5
最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型,还在效率上有所突破。DBRX的基础和微调版本均已发布,为研究和商业应用提供了丰富的资源。 GitHub 链接:https:/...
-
号称全球最强开源 AI 模型,DBRX 登场:1320 亿参数,语言理解、编程能力等均超 GPT-3.5
3 月 28 日消息,初创公司 Databricks 近日发布公告,推出了开源 AI 模型 DBRX,声称是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。 DBRX 采用 transformer 架构,包含 1320...
-
Amazon SageMaker + Stable Diffusion 搭建文本生成图像模型
如果我们的计算机视觉系统要真正理解视觉世界,它们不仅必须能够识别图像,而且必须能够生成图像。文本到图像的 AI 模型仅根据简单的文字输入就可以生成图像。 近两年,以ChatGPT为代表的AIGC技术崭露头角,逐渐从学术研究的象牙塔迈向工业应用的广阔天...
-
国产大模型最近挺猛啊!使用Dify构建企业级GPTs;AI阅读不只是「总结全文」;我的Agent自媒体团队;Nijijourney官方AI绘画课完结啦! | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 大模型近期重大进展:百川、讯飞、智源发布新模型,GLM-4、DeepSeek上线开放平台,Google Bard 反超,Mixtral medium 泄...
-
Midjourney教学使用教程,AI绘图赏析prompt,手把手教你Midjoureny注册和使用
一、引言 话不多说请先赏图: 目前 Midjourney 暂不支持免费次数了,尽量付费吧。 如果不清楚如何付费请参考:【保姆级】国内如何购买midjourney?midjourney购买教程?midjourney注...
-
Whisper实现语音识别转文本
#教程 主要参考开源免费离线语音识别神器whisper如何安装,OpenAI开源模型Whisper——音频转文字 Whisper是一个开源的自动语音识别系统,它在网络上收集了680,000小时的多语种和多任务监督数据进行训练,使得它可以将多种语言的音频...
-
【AIGC】prompt工程从入门到精通--图片生成专题
本文为系列教程【AIGC】prompt工程从入门到精通的子教程。 一、介绍 与文本提示相比,找到最佳的提示词来生成完美的图片并没有那么成熟。这可能是因为创建对象自身的挑战,这些对象基本上是主观的并且往往缺乏良好的准确性度量方法。 本指南涵盖了基本的...
-
人工智能提示指南:天才还是噱头?
每个人都知道,你不应该向《阿拉丁神灯》中的精灵许愿要更多的愿望。但是,当我得到一个拥有令人印象深刻的大型语言模型(LLM)的AI驱动聊天机器人,并且它用它的回答让我感到惊讶时,我还是这样做了。我要求它为我写一个提示指南,将每个提示变成魔法咒语,着迷于让L...
-
不到百行代码,使用Whisper进行视频字幕生成。
前言 最近在学习视频剪辑的时候,希望找一款软件进行翻译;发现大多数是调用某云的Api进行翻译。通过查询资料,打算使用Whisper进行本地视频语音的识别,然后进行字幕文件的编辑(srt),最后通过ffmpeg添加到视频中。 Whisper 是...
-
20240202在WIN10下使用whisper.cpp
20240202在WIN10下使用whisper.cpp 2024/2/2 14:15 【结论:在Windows10下,确认large模式识别7分钟中文视频,需要83.7284 seconds,需要大概1.5分钟!效率太差!】 83.7284/420=0...
-
【AIGC】AI作图最全提示词prompt集合(收藏级)
目录 一、正向和负向提示词 二、作图参数 你好,我是giszz. AI做图真是太爽了,解放生产力,发展生产力。 但是,你是不是也总疑惑,为什么别人的图,表现力那么丰富呢,而且指哪打哪,要什么有什么,而你只能等着AI“智能推荐”?从多次重复中...
-
whisper 强大且开源的语音转文字
说起来语音转换文字,openai旗下的whisper很是好用,推理也很快,同时支持cpu和GPU。 GitHub:GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Wea...
-
midjourney提示词语法
更高级的提示可以包括一个或多个图像URL、多个文本短语和一个或更多个参数 Image Prompts 可以将图像URL添加到提示中,以影响最终结果的样式和内容。图像URL总是位于提示的前面。 https://docs.midjourney...
-
webassembly002 whisper.wasm wasm_eval 与js代码交互 js部分
html的js <script type="text/javascript" src="https://blog.csdn.net/ResumeProject/article/details/helpers.js"><...
-
【MacOS】openai 语音识别模型 whisper 本地部署教程(cpu+mps方案)
目录 1. whisper 安装 openai-whisper 参考视频链接与安装过程 安装homebrew 安装Python (不要超过3.10) 安装Pytorch 安装ffmpeg 安装rust 安装whisper 注意事项 可...
-
Meta AI 发布 MMCSG数据集:使用 Project Aria 捕获的 25 小时以上的双向对话
Meta AI 最近发布了 MMCSG 数据集,该数据集包含使用 Project Aria 录制的25小时以上的双向对话。CHiME-8MMCSG 任务的重点是转录使用智能眼镜录制的对话,这些眼镜配备了多个传感器,包括麦克风、摄像头和惯性测量单元(IMUs...
-
chatGPT生成stable diffusion 提示词
1.将prompt发给chatGPT 输入: # Stable Diffusion prompt 助理 你来充当一位有艺术气息的Stable Diffusion prompt 助理。 ## 任务 我用自然语言告诉你要生成的prompt的主题,你的...
-
如何使用生成式人工智能构建实时Slackbot
译者 | 李睿 审校 | 重楼 本文将展示如何使用由Apache NiFi支持的Cloudera DataFlow与IBM WatsonX交互。人工智能实时建立大型语言模型,并且可以使用任何基础模型,例如谷歌FLAN T5 XXL或IBM Granite...
-
DeepMind CEO专访:AI还没到拼算力的时候,谷歌优势在研发,智能体是下一个爆点
GoogleDeepMind首席执行官Hassabis最近在接受WIRED采访时表示,AI技术现在还有很大的改进空间,还远没有到只能拼算力的时候。谷歌的优势在于科研能力,未来智能体将改变AI的格局。 虽然谷歌的Gemini在开年的AI产品大战中没有获得太多...
-
1024 分辨率下最快模型,字节跳动文生图开放模型 SDXL-Lightning 发布
模型|https://huggingface.co/ByteDance/SDXL-Lightning 论文|https://arxiv.org/abs/2402.13929 1、闪电般的图片生成 生成式 AI 正凭借其根据文本提示(text prom...
-
Stable Diffusion WebUI常用Tag收集
捆绑(nsfw *可以直接加人物lora Masterpiece, high quality, beautiful wallpaper, 16k, animation, illustration, positive perspective, perf...
-
Stable Diffusion WebUI 踩坑记录
文章目录 install Homebrew install python 3.10 clone stable diffusion web 设置 pip 国内源 install 如果 torch 安装有问题可以这样安装 Install GFPG...
-
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraf...
-
Midjourney-摄影师的7招
@TOC 完整句式: 1. 第一招:控制快门速度 1.1 快的快门速度 1.2 highspeed photography 高速摄影 1.3 slow movement 慢动作 1.4 Bullet Time 子弹...
-
AIGC内容分享(五十五):AIGC周刊
目录 行业资讯 产品推荐 学习资料 拓展阅读 Midjourney生成 the camera focuses on the young woman, her red Hanfu a stark contrast against...
-
在人工智能时代,Django + 简单的 HTML + Whisper + mixtral-8x7b-instruct + SQLite 实现了一个 TODO应用
这里写自定义目录标题 构建 AI-powered TODO 应用 新的思考 构建 AI-powered TODO 应用 人工智能TODO应用程序演示https://ivan-tolkunov–surukoto-run.modal....
-
Midjourney 中 /show 与 Job ID
Midjourney 提供了多种指令和工具,帮助用户在使用过程中更高效地管理和创作图像。其中,/show 指令是一个非常有用的功能,允许用户操作特定的图像生成任务。 使用 /show 指令 /show 指令可以与独特的作...
-
清华系2B模型杀出,性能吊打LLaMA-13B
2 月 1 日,面壁智能与清华大学自然语言处理实验室共同开源了系列端侧语言大模型 MiniCPM,主体语言模型 MiniCPM-2B 仅有 24 亿(2.4B)的非词嵌入参数量。 在综合性榜单上与 Mistral-7B 相近,在中文、数学、代码能力表现更...
-
Stable Diffusion prompt绘画提示词
Stable Diffusion prompt 助理 你来充当一位有艺术气息的Stable Diffusion prompt 助理。 任务 我用自然语言告诉你要生成的prompt的主题,你的任务是根据这个主题想象一幅完整的画面,然后转化成一份详细...
-
【whisper】在python中调用whisper提取字幕或翻译字幕到文本_python whisper
一、whisper简介 whisper 是一款用于语音识别的开源库,支持多种语言,其中包括中文。在本篇文章中,我们将介绍如何安装 whisper 以及如何使用它来识别中文字幕。 二、安装 whisper 首先,我们需要安装 whisper。根据操...
-
Amazon Code Whisperer 的正式使用,全新 AI 代码工具等你发现!(内附详细安装步骤图解)
文章作者:稚始稚终 关于 Code Whisperer Code Whisperer,亚马逊推出的实时 AI 编程助手,是一项基于机器学习的服务,它可以分析开发者在集成开发环境(IDE)中的注释和代码,并根据其内容生成多种代码建议。 开发者可以用...
-
奥特曼7万亿美元芯片帝国野心曝光,OpenAI日产1000亿单词欲接管全世界!
【新智元导读】Sam Altman表示,自己需要7万亿美元建起全球的芯片帝国,他已经在全球搜罗金主,包括中东土豪。 就在刚刚,Sam Altman发推表示: 如今,OpenAI每天能够创造出约1000亿字的内容,而全世界的人类每天总共能产生约100万亿字。...
-
Whisper 从0安装教程 windows
这里写自定义目录标题 Whisper 从0安装教程 windows 安装过程 安装python3.11 安装Anaconda 在Anaconda里面安装whisper 安装 ffmpeg 第一次运行whisper 检查GPU 一些弯路...
-
深度学习系列56:使用whisper进行语音转文字
1. openai-whisper 这应该是最快的使用方式了。安装pip install -U openai-whisper,接着安装ffmpeg,随后就可以使用了。模型清单如下: 第一种方式,使用命令行: whisper japanese.wav...
-
Midjourney 提示词入门 | 提示词格式 特点如何写好自己的提示词?进阶技巧
文章目录 1 Prompt格式 2 文本提示词的基本要求 3 好的文本提示词的特点 上一节我们初步了解了Midjourney的使用 那么在使用过程中最重要的是通过Prompt告知Midjourney怎么画 因而高效写Prompt...
-
实战whisper:本地化部署通用语音识别模型
前言 Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 这里呢,我将给出我的一些代码,来帮助你尽快实现【语音转文字】的服务部署...
-
20240127在ubuntu20.04.6下配置whisper
20240131在ubuntu20.04.6下配置whisper 2024/1/31 15:48 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最新的驱动...
-
Amazon CodeWhisperer 代码提示——Golang 测评
前言 官网链接: 亚马逊云科技 Amazon CodeGuru Reviewer 中的 CodeWhisperer 是一种代码提示工具,它使用机器学习和人工智能技术来提高开发人员的代码质量和效率。它可以通过分析代码库中的历史代码和最佳实践,为开发...
-
AIGC-Stable Diffusion Webui-AI作画初体验
一、项目地址:传送门:github:stable-diffusion-webui 二、安装方式:本地安装 or Google Colab.(下文介绍中关于安装的部分均以本地安装为例 本地安装: 1、git 2、python(推荐3.10.8 ...
-
如何使用OpenAI的whisper
文章目录 一、安装ffmpeg 二、安装torch等相关组件 三、安装Whisper 四、下载模型 五、测试效果 六、cpu与gpu解码的耗时对比 参考文献 一、安装ffmpeg yum localinstall --nogpgc...
-
通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5
赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。 新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medi...
-
20240131在ubuntu20.04.6下使用whisper不同模式的比对
20240131在ubuntu20.04.6下使用whisper不同模式的比对 2024/1/31 16:07 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】 2、请正确安装好NVIDIA最新...
-
20240126请问在ubuntu20.04.6下让GTX1080显卡让whisper工作在large模式下?
20240126请问在ubuntu20.04.6下让GTX1080显卡让whisper工作在large模式下? 2024/1/26 21:19 问GTX1080模式使用large该如何配置呢? 这个问题没有完成,可能需要使用使用显存更大的显卡了! 比如G...
-
【MIdjourney】关于图像中人物视角的关键词
本篇仅是我个人在使用过程中的一些经验之谈,不代表一定是对的,如有任何问题欢迎在评论区指正,如有补充也欢迎在评论区留言。 1.全景镜头(panorama 全景镜头是一种广角镜头,可以捕捉到比普通镜头更广阔的视野范围。全景镜头(又称鱼眼镜头)通常具有非常...
-
比OpenAI官方提示词指南更全,这26条黄金准则让LLM性能飙升50%以上
论文地址: https://arxiv.org/abs/2312.16171 Github地址: https://github.com/VILA-Lab/ATLAS 论文标题:Principled Instructions Are All You...
-
Amazon CodeWhisperer 免费的 AI 代码生成助手!最新体验反馈~
文章作者:段小草 自这一波生成式 AI 浪潮以来,大家尝鲜之余最关心的问题还是如何提高生产力。我们在测试大语言模型能力的时候,往往会将代码能力作为一项重要的评价指标,也说明程序员还是希望能在 AI 的加持下更快捷安全地编写代码。 亚马逊云科技...