-
使用openai-whisper实现语音转文字
使用openai-whisper实现语音转文字 1 安装依赖 1.1 Windows下安装ffmpeg FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化...
-
出门问问开放大模型“序列猴子”开源数据集
出门问问宣布,将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集,命名为“序列猴子开源数据集1.0”。 序列猴子,作为出门问问的核心技术之一,具备强大的通用表示与推理能力,已在问答系统、自然语言处理、机器翻译、文本摘要等多个领域展现出其卓越的性能,...
-
打入AI底层!NUS尤洋团队用扩散模型构建神经网络参数,LeCun点赞
扩散模型,迎来了一项重大新应用—— 像Sora生成视频一样,给神经网络生成参数,直接打入了AI的底层! 这就是新加坡国立大学尤洋教授团队联合UCB、Meta AI实验室等机构最新开源的研究成果。 具体来说,研究团队提出了一种用于生成神经网络参数的扩散模...
-
AIGC 实战:如何使用 Docker 在 Ollama 上离线运行大模型(LLM)
Ollama简介 Ollama 是一个开源平台,用于管理和运行各种大型语言模型 (LLM ,例如 Llama 2、Mistral 和 Tinyllama。它提供命令行界面 (CLI 用于安装、模型管理和交互。您可以使用 Ollama 根据您的需求下载...
-
webassembly003 whisper.cpp的python绑定实现+Cython+Setuptools
python绑定的相关项目 官方未提供python的封装绑定,直接调用执行文件 https://github.com/stlukey/whispercpp.py提供了源码和Cpython结合的绑定 https://github.com/zh...
-
干货满满!大神Karpathy两小时AI大课文字版第一弹,全新工作流自动把视频转成文章
前段时间,AI大神Karpathy上线的AI大课,已经收获了全网15万次播放量。 当时还有网友表示,这2小时课程的含金量,相当于大学4年。 就在这几天,Karpathy又萌生了一个新的想法: 那便是,将2小时13分钟的「从头开始构建GPT分词器」的视频...
-
一手借东风,Reddit把用户「卖」了个好价钱;AI增强搜索工具清单(私藏版);2024年Star飙升的LLM学习路线图;AIGC教育行业全景报告 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 国产大模型进入生态构建阶段,纷纷出炉开发者激励计划 https://www.moonshot.cn 2月5日,月之暗面 Moonsho...
-
AI语音识别模块--whisper模块
1.下载 ffmpeg,挑一个自己电脑系统的版本,下载,如我win64: 地址: Releases · BtbN/FFmpeg-Builds · GitHub 下载压缩包zip,到·本地 解压安装,其实无需安装,只需把对应的目录下的bin,...
-
让你的自媒体文章更有魅力:这10款ai写作工具你一定不能错过! #其他#AI写作#AI写作
很多小伙伴想要自己做自媒体,但是却不知道从何下手,今天我就和大家分享一波好用的一些自媒体工具。 1.红桃写作 这是一个微信公众号 面向专业写作领域的ai写作工具,写作助手包括,ai论文,ai开题报告、ai公文写作、ai商业计划书、文献综述、a...
-
《Stable Diffusion WebUI折腾实录》在Windows完成安装, 从社区下载热门模型,批量生成小姐姐图片
环境 操作系统: Windows11 显卡: RTX2060 6GB 显存 安装Python 下载 Python3.10.6 https://www.python.org/ftp/python/3.10.6/python-3.10.6-amd64...
-
AI绘画专栏之Comfyui之AnimateDiffLCM更快效果更佳工作流分享
AnimateLCM能够在很少的步骤中生成高质量的视频。相比直接在原始视频数据集上应用一致性学习,该项目提出了一种解耦的一致性学习策略,分别对图像生成的基础知识和运动生成的基础知识进行提炼。这种策略提高了训练效率并提升了生成视频的视觉质量。 那么关于两个...
-
目标检测新SOTA:YOLOv9问世,新架构让传统卷积重焕生机
继 2023 年 1 月 YOLOv8 正式发布一年多以后,YOLOv9 终于来了! 我们知道,YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来,领域内的研...
-
AI图像(AIGC for PIC)大模型实战|Stable Diffusion
AI GC text to pic 图像生成模型 目前随着AIGC模型的火爆,AI内容创作远超人类创造水平和能力,极大了提升了创作空间。 为此我们要接触新鲜事物,用于尝试新技术。 那针对目前火爆的AImodel我们开始进行学习,尝试本地化部署,生成...
-
Copilot:编程助手,你真的需要它吗?使用体验对比分享
大家好,我是烤鸭: 最近ai火的狠,想聊聊代码里的copliot,最近几个月也使用了几款不同的copliot。 什么是copliot copliot 是ai助手,我们要说的是编程界的copliot。 先介绍几款我用过的: github c...
-
Copilot 插件的使用介绍:如何快速上手
GitHub Copilot 本文主要介绍如何通过脚本工具激活 GitHub Copilot 插件,提供安装及激活图文教程,大家按下面操作即可激活GitHub Copilot插件,免费使用Ai编码工具 一、GitHub Copilot 介绍 GitH...
-
保姆级amd显卡win11搭建stable diffusion教程,GPU运算,而不是CPU运算!!!
1.安装Git 2.安装python python版本一定要是3.10.6 如果是其他版本,请卸载后再重新安装此版本 3.git代理配置 此步骤主要是解决拉github源码慢的问题,如果有vpn客户端的同学,记得要单独再配置下git的代理配置...
-
谷歌最新开源的 Gemma 模型,秒杀 Llma-2!
Gemma 是什么 Gemma 是一个轻量级、最先进的开放式模型系列,采用了与创建 Gemini 模型相同的研究和技术。Gemma 由 Google DeepMind 和 Google 的其他团队共同开发,其灵感来源于双子座,名字反映了拉丁语 gemm...
-
SoraWebui之后,又有开发者开源Sora AI视频生成器模板sorafm
最近,Sora爆火,但由于还没正式开放,大多数网友只能眼巴巴看着。开发者们也不闲着,先把“壳子”弄好,就等着Sora正式开放,填个API就行了。 比如之前给大家介绍过的SoraWebui,目前通过模拟 DALL-E3的 API 接口字段进行实现。 地址:...
-
Karpathy离职OpenAI,首发2小时AI大课!从头开始构建GPT分词器
离职OpenAI的技术大神karpathy,终于上线了2小时的AI大课。 ——「让我们构建GPT Tokenizer(分词器)」。 其实,早在新课推出两天前,karpathy在更新的GitHub项目中,就预告了这件事。 这个项目是minbpe——专为...
-
copilot插件使用介绍
Copilot 是一款由 GitHub 和 OpenAI 共同开发的智能编程助手,可以根据您的输入快速生成代码片段。下面是 Copilot 插件的使用介绍: 1.安装插件: • 打开 Visual Studio Code(VS Code)编辑器。...
-
新手如何拿捏 Github Copilot AI助手,帮助你提高写代码效率
GitHub Copilot 是什么 Copilot (https://copilot.github.com/ 是由 Github 提供的AI编码辅助工具,它可以在编码过程中提供基于 AI 学习的编码建议。在很多情况下,只需要有注释或者函数名称,Co...
-
为 Windows10 22H2 启用 Microsoft Copilot 功能
文章目录 背景 启用 Copilot 步骤 开启 Copilot 入口 启用 Copilot 功能 系列地址 本文初发于 “偕臧的小站”,同步转载于此。 简 述: 作为 Window 10 22H2 的长期使用者,也开...
-
GitHub Copilot(包括Github Copilot Chat)的使用
目录 1.在Pycharm下载GitHub Copilot插件 2.使用Github账号授权 3.使用GitHub Copilot 3.1 接受或者拒绝代码建议 3.2 查看下一个建议 3.3 接受部分建议 3.4 根据注释生成代码建议 4...
-
谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即
离职OpenAI的技术大神karpathy,终于上线了2小时的AI大课。 ——「让我们构建GPT Tokenizer(分词器)」。 图片 其实,早在新课推出两天前,karpathy在更新的GitHub项目中,就预告了这件事。 图片 这个项目是minbpe...
-
3秒实现无痛基于Stable Diffusion WebUI安装ComfyUI!无需重复安装环境!无需重复下载模型!安装教程
标题略有夸张哈哈哈哈,但想表达的是,相较于直接下载或者通过秋叶包更新而,接下来这一套方案确实很简单,而且能够 大大节省磁盘空间,和下载时间。 这篇教程不需要你有: 代码基础。都是复制粘贴就完事。 魔法。 这篇教程默认你已经有: 1. 本地能够正...
-
OpenAI员工自曝“996”加班实锤 ChatGPT热潮下工作生活失衡
近日,OpenAI员工过劳问题再次浮出水面。该公司思维链项目团队员工、前谷歌工程师Jason Wei日前在社交平台上晒出自己一天的详细作息时间表,从早上9点工作至次日凌晨1点15分,几乎没休息。 图中这位员工的一天被安排得满满当当,工作与生活之间鲜有间隙...
-
出圈的Sora带火DiT,连登GitHub热榜,已进化出新版本SiT
虽然已经发布近一周时间,OpenAI 视频生成大模型 Sora 的影响仍在继续! 其中,Sora 研发负责人之一 Bill Peebles 与纽约大学助理教授谢赛宁撰写的 DiT(扩散 Transformer)论文《Scalable Diffusion...
-
OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】
目录 环境配置 代码实现 ****** 实现 .mp4转换为 .wav文件,识别后进行关键词匹配并输出关键词出现的次数 ****** 完整代码实现请私信 环境配置 安装 ffmpeg 打开网址 https://githu...
-
看完就会!手把手入门开源AI绘图Stable Diffusion
AIGC现如今可谓是如日中天,AI绘画算是其中最火的了。现在的AI绘图工具也是百家争鸣,不管是网页端,APP端,还是小程序端,都能看到各种各样的AI绘图工具,他们多是需要你发送关键词或绘图命令到他们的服务器,然后由服务器渲染完成之后返图给你,所以一定会占用...
-
被字节辟谣的中文版Sora,究竟厉害在哪里?
撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 近日,市场有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款新型视频模型Boximator,与Gen-2、Pink1.0等既有模型相比,Boximator的独特...
-
四个优秀AI Agent开源项目,谈一谈大模型、人工智能代理
什么是AI Agent? 现在我们与大模型的互动,一般的过程是先输入一个提示词,之后,大模型根据输入内容进行计算并响应。每次想要得到一个新的输出,我们就必须再提供一个提示词。这个过程有点麻烦,因为总是要有人来驱动。 AI Agent(人工智能代理)则以不...
-
AIGC:腾讯云服务器快速部署stable-diffusion环境,使用ChilloutMix模型进行画图
文章目录 @[toc] 背景 一. **购买服务器** 二. **前置配置** 三. **部署webui,完成配置** 四. **其他探索** 其他 背景 前两天在某公众号的软文刷到了AI绘画领域最新的ChilloutM...
-
OpenAI员工自曝996作息表,网友:真正的卷不需要强迫
OpenAI也996,实锤了(doge)。 思维链作者、从谷歌跳槽OpenAI的Jason Wei刚刚分享了自己在OpenAI的一天: [9:00am] 起床[9:30am] 搭乘Waymo前往Mission SF,途中在Tartine买个牛油果吐司[9...
-
20分钟学会装配电路板!开源SERL框架精密操控成功率100%,速度三倍于人类
近年来,机器人强化学习技术领域取得显著的进展,例如四足行走,抓取,灵巧操控等,但大多数局限于实验室展示阶段。将机器人强化学习技术广泛应用到实际生产环境仍面临众多挑战,这在一定程度上限制了其在真实场景的应用范围。强化学习技术在实际应用的过程中,任需克服包括...
-
OOTDiffusion官网体验入口 AI虚拟试衣开源工具网页版免费使用地址
OOTDiffusion是一个基于潜在扩散模型的虚拟服装试穿开源工具。它支持半身和全身两种模型,可以实现服装的自然融合。用户可以通过调节各种参数实现对试穿效果的精确控制,满足不同的需求。该工具开源在GitHub上,已获得超过 300 星的关注。 点击前往...
-
英伟达NeMo框架在AI领域的综合应用与优势总结
一、NeMo 框架介绍 NVIDIA NeMo 是基于 PyTorch 和 PyTorch Lightning 的一个开源训练框架,源代码完全公开在 GitHub 上。NeMo 的主要目标是使 AI 开发者能够快速构建对话式 AI 模型并开发相关应用。...
-
【本地运行AI绘画】ComfyUI的安装与使用(一)(windows+1660ti 6G显存)
官方源码:https://github.com/comfyanonymous/ComfyUI/ 官方环境包: https://github.com/comfyanonymous/ComfyUI/releases百度网盘下载: 显卡驱动cu11+以下下载cu...
-
stable-diffusion | v1-5-pruned.ckpt和v1-5-pruned-emaonly.ckpt的区别
https://github.com/runwayml/stable-diffusion?tab=readme-ov-file#reference-sampling-script 对于 1.5 模型,其中可能包括四部分:标准模型、文本编码器、VAE...
-
【AIGC】Stable Diffusion的常见错误
Stable Diffusion 在使用过程中可能会遇到各种各样的错误。以下是一些常见的错误以及可能的解决方案: 模型加载错误:可能出现模型文件损坏或缺失的情况。解决方案包括重新下载模型文件,确保文件完整并放置在正确的位置。 依赖项错误:Stable...
-
Github Copilot是什么?Ai高效编程!一键远程授权…
GitHub Copilot是一款Ai编程插件,由OpenAi和Github联合推出,目前支持主流的IDE编辑器安装使用,包括JetBrains IDEs、VSCode、Visual Studio、Neovim等。 官方地址:https://gith...
-
离开OpenAI的大神卡帕西「开课了」:新项目日增千星,还是熟悉的min代码风
大神Karpathy从OpenAI离职,原本扬言要大休一周。 图片 但转眼,新项目就已上线GitHub,日增上千星的那种。 图片 还是熟悉的卡式配方: 74行Python代码搞定大模型标记化(tokenization)中常用的BPE(Byte Pair...
-
GitHub热榜第一:百万token上下文,还能生成视频,UC伯克利出品
今日GitHub热榜榜首,是最新的开源世界模型。 上下文窗口长度达到了100万token,持平了谷歌同时推出的王炸Gemini 1.5,伯克利出品。 强大的模型,命名也是简单粗暴——没有任何额外点缀,直接就叫LargeWorldModel(LWM)。...
-
stable-diffusion-webui 界面汉化
本教程通过安装 sd-webui-bilingual-localization 插件来达到汉化目的, 项目地址为:https://github.com/journey-ad/sd-webui-bilingual-localization 一、安装插件...
-
政安晨:演绎在KerasCV中使用Stable Diffusion进行高性能图像生成
小伙伴们好,咱们今天演绎一个使用KerasCV的StableDiffusion模型生成新的图像的示例。 考虑计算机性能的因素,这次咱们在Colab上进行,Colab您可以理解为在线版的Jupyter Notebook,还不熟悉Jupyter的的小伙伴可以...
-
Python进行AI声音克隆的端到端指南
人工智能语音克隆是一种捕捉声音的独特特征,然后准确性复制它的技术。这种技术不仅可以让我们复制现有的声音,还可以创造全新的声音。它是一种彻底改变内容创作的工具,从个性化歌曲到自定义画外音,开辟了一个超越语言和文化障碍的创意世界。 本文的将提供利用AI语音...
-
如何系统的自学Python?通义千问、讯飞星火、文心一言及ChatGPT的回答
如何系统的自学Python?来看看通义千问、讯飞星火、文心一言及ChatGPT的回答. 第一个是马老师的通义千问 系统地自学Python是一个循序渐进的过程,从基础语法到实践项目,再到专业领域的深入学习。下面是一个详细的步骤指南: 了解Pyt...
-
使用LlamaIndex和ChatGPT的无代码检索增强生成(RAG)
检索增强生成(RAG 是使用大型语言模型(LLM 的关键工具。RAG使LLM能够将外部文档合并到它们的响应中,从而更紧密地与用户需求保持一致。这个功能在传统上使用LLM犹豫不决的领域尤其有益,尤其是在事实很重要的时候。 自从ChatGPT和类似的LLM推...
-
训不动Mixtral,要不试试LLaMA-MoE?
深度学习自然语言处理 原创作者:cola 随着各种各样增强版LLaMA的出现,Mixture-of-Expert(MoE 类模型越来越受大家关注。而LLaMA-MoE正是基于LLaMA系列和SlimPajama的MoE模型。它显著的一个好处...
-
近期关于AIGC方面的学习笔记和思路整理
LLM 对于LLM,我现在重点关注在这几个方面: 开源且可私有化部署的代码生成模型: 因为大部分软件企业对于安全都很重视,文档、数据、代码一般都会尽量避免被泄露。所以很难使用类似Copilot或者OpenAI的Bito这种需要连到互联网上的服务。如果...
-
Stable Diffusion的 webui 如何在Windows上使用 AMD GPU显卡?
根据Stable Diffusion官方说明 webui 是不支持AMD GPU显卡的,所以在国内如果想省点事情要玩Stable Diffusion (SD 推荐用黄教主的英伟达显卡NVIDIA GPU,可以省心不少。 AMD显卡得用 webui-di...