-
whisper使用
whisper使用 1. 直接调用 语音识别 2. 语种识别 whisper.detect_language( 和whisper.decode( 3. 指定要识别的语种做语音识别 **whisper 源码的transcribe函数** 函数解...
-
100% 开源 Llama 编码助手:设置 Cody 和 VSCode
好吧,今天我有一些非常令人兴奋的事情要与大家分享! 我们都知道,编码助手永久地改变了我们开发软件的方式,但 GPT-4 等高级法学硕士的高昂价格一直是许多人的绊脚石。 但好消息是:成本不再是障碍! 有了像 Code Llama 7B 这样的法学硕士,...
-
区分stable diffusion中的通道数与张量维度
区分stable diffusion中的通道数与张量形状 1.通道数: 1.1 channel = 3 1.2 channel = 4 2.张量形状 2.1 3D 张量 2.2 4D 张量 2.2.1 通常 2.2.2 stable d...
-
Llama模型家族之Stanford NLP ReFT源代码探索 (三)reft_model.py代码解析
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
文心一言 VS 讯飞星火 VS chatgpt (225)-- 算法导论16.3 7题
七、推广赫夫曼算法,使之能生成三进制的码字(即码字由符号0、1、2组成 ,并证明你的算法能生成最优三进制码。如果要写代码,请用go语言。 文心一言: 推广赫夫曼算法以生成三进制码字需要对算法进行一定的修改,确保在每一步选择频率最低的三个节点进行合并...
-
五分钟上手IoT小程序
五分钟上手IoT小程序 IoT小程序框架 搭建开发环境 首先安装NodeJs 安装NodeJs 验证安装成功 安装cnpm 安装VSCode 开发IDE 下载开发IDE 安装开发IDE 安装框架脚手架 下载模拟器 创建工程项目 应用...
-
midjourney绘画,midjourney api接口国内如何对接
项目背景 众所周知,Midjourney并没有提供任何的Api服务,但是基于Midjourney目前的行业龙头位置,很多企业以及个人会有相关的需求。TTApi平台基于Midjourney现有功能整理出一套完整的可集成性高的服务,如果你有类似的需求,那么恭...
-
苹果解释 iOS 18 中的 AI 文本生成表情符号 Genmoji 工作原理
iOS 18 中的一项 Apple Intelligence 功能是 Genmoji,它允许 iPhone 用户通过 AI 根据文本输入生成全新的表情符号角色。根据 iOS 18 在 WWDC 会议上的介绍,Genmoji 看起来类似于传统的表情符号,但它...
-
github Copilot的使用总结
1. 代码建议和补全 GitHub Copilot 的基本使用涉及编写代码时的实时代码建议和补全。一旦你已经安装并配置好 GitHub Copilot 插件,你可以在支持的编辑器(如 Visual Studio Code)中开始使用 Copilot。以下...
-
五一超级课堂---Llama3-Tutorial(Llama 3 超级课堂)---第三节llama 3图片理解能力微调(xtuner+llava版)
课程文档: https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频: https://space.bilibili.com/3546636263360696/channel/collectiondetail?...
-
百度文心一言API4.0 Python调用ERNIE-4.0-8K详细教程
ERNIE 4.0是百度自研的旗舰级超大规模⼤语⾔模型,相较ERNIE 3.5实现了模型能力全面升级,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效,支持5K tokens输入+2K tokens输出。ERNIE-4.0-8K是模...
-
Midjourney Imagine API 申请及使用
Midjourney Imagine API 申请及使用 申请流程 要使用 Midjourney Imagine API,首先可以到 Midjourney Imagine API 页面点击「Acquire」按钮,获取请求所需要的凭证: 如果你尚未...
-
爬虫概念、基本使用及一个类型和六个方法(一)
目录 一、爬虫简介 1.什么是爬虫 2.爬虫的核心 3.爬虫的用途 4.爬虫的分类 5.反爬手段 二、Urllib基本使用 1.导入我们需要的包 2.定义一个url 3.模拟浏览器向服务器发送请求 4.获取响应中的页面的源码 5....
-
Llama 3 Web Demo 部署- XTuner 小助手微调- LMDeploy 部署 Llama 3
1 Llama 3 Web Demo 部署 本博客为基于机智流、Datawhale、ModelScope:Llama3-Tutorial(Llama 3 超级课堂)的作业。 1.1 环境部署 使用VSCode远程连接InterStudio开发机,并配...
-
【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents
文章目录 一、前言 (一)DALLE2 简介 (二)DALLE2和DALLE的对比 (三)相关模型推出时间 二、文章概要 (一)标题 (二)摘要 (三)引言 (四)模型架构 三、方法 (一)图像生成的相关工作 (二)diffusion...
-
探秘Whisper Diarization:语音转文字与对话分割的新锐工具
探秘Whisper Diarization:语音转文字与对话分割的新锐工具 项目地址:https://gitcode.com/MahmoudAshraf97/whisper-diarization 项目简介 Whisper Diarization 是...
-
AI绘画神器ComfyUI 整合包:工作流界面,解压即用,快速入门AI绘画
上周赛博佛祖秋葉 Aki 发布了针对 ComfyUI 的整合安装包,让这款原本偏专业的 AI 绘画工具对初学者来说更容易上手使用了,我也安装试用了一下,的确非常方便,今天就为大家详细介绍一下整合包的用法 ~ 一、ComfyUI 简介 ComfyU...
-
详细解析AI作画原理及相关理论
先来欣赏AI作画 人物方面: 欣赏AI作画自然意境: 目录 引言 一、AI作画原理 二、相关理论 1. 风格迁移理论 2. 生成对抗网络(GAN) 三、代码示例 进一步的优化和改进可能包括: 总结: 引言...
-
【腾讯云 HAI域探秘】——即时职场生存指南小游戏以及【自行搭建Stable Diffusion图片AI绘制 ChatGLM2-6B AI进行智能对话 Pytorch2
六、jupyter_lab操作步骤 1、进入jupyter_lab操作页面 操作页面效果 2、面板功能介绍 3、启动服务 命令如下,直接复制并【ctrl+v】即可 cd /root/stable-diffusion-webu...
-
区分LLaMA、llama.cpp和Ollama
大模型本地部署和运行中,经常遇到这三个概念,llama,ollama,llama.cpp。 刚开始接触时,的确有些傻傻分不清楚。这里简单区分理解下,方便快速上手。 简单来讲,llama 是一个Meta公司开源的预训练大型语言模型,llama.cpp用于加...
-
【V831】智能语音对话:语音识别、文心一言回答、语音合成
1、实验设备 01科技的V831 2、总体概述 按下按键,蓝灯亮起,开始定时录音,录音结束,蓝灯熄灭。接着,通过百度的语音识别API进行语音转文字,得到文字后通过百度的文心一言API进行回答,得到的回答通过百度的语音合成API把回答的文字合成为音...
-
天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早期工作
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(一):回顾早期工作 在2022年的这波AI绘画浪潮中,Stable Diffusion无疑是最受欢迎的图像生成模型。究其原因,第一...
-
【全网瞩目】你想知道的Llama3都在这里
Meta发布了开放式生成人工智能模型 Llama 系列的最新产品: Llama 3。或者更准确地说,该公司首次发布了其新的 Llama 3 系列中的两个模型,其余模型将在未来某个不确定的日期发布。 Meta 称,与上一代 Llama 型号 Llama 2...
-
使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion_sagemaker ai绘图
目前人工智能模型可以分为两大类别,包括判别模型 (Discriminative Model 与生成模型 (Generative Model 。判别模型根据一组输入数据,例如文本、X 射线图像或者游戏画面,经过一系列计算得到相应目标输出结果,例如单词翻译结...
-
Copilot安装和使用最全教程
背景 Copilot 是一款由 GitHub 和 OpenAI 合作开发的代码辅助工具。它基于 OpenAI 的大型语言模型 GPT-3.5,专为帮助软件开发者提升编程效率而设计 Copilot的主要功能是通过理解用户输入的代码注释或部分代码片段、自动生...
-
Spring Boot后端调用文心一言响应式问答
Spring Boot后端调用文心一言响应式问答 1.获取文心服务 要在我们的后端服务中接入文心一言,就要获取文心的服务,首先我们要进入百度智能云中注册一个账号:https://console.bce.baidu.com/qianfan/ais/...
-
AIGC笔记--VQVAE模型搭建
1--VQVAE模型 VAE 模型生成的内容质量不高,原因可能在于将图片编码成连续变量(映射为标准分布),然而将图片编码成离散变量可能会更好(因为现实生活中习惯用离散变量来形容事物,例如人的高矮胖瘦等都是离散的;) ...
-
Stable Diffusion原理
一、Diffusion扩散理论 1.1、 Diffusion Model(扩散模型) Diffusion扩散模型分为两个阶段:前向过程 + 反向过程 前向过程:不断往输入图片中添加高斯噪声来破坏图像 反向过程:使用一系列马尔可夫链逐步将噪声还原...
-
基于Llama 2家族的提示词工程:Llama 2 Chat, Code Llama, Llama Guard
Prompt Engineering with Llama 2 本文是学习 https://www.deeplearning.ai/short-courses/prompt-engineering-with-llama-2/ 的学习笔记。...
-
LLaMa大模型微调
1. 模型的微调 1.1 大模型LLaMa下载 先下载一个完整版本的LLaMa模型,官网的或别人下载微调过的中文版本的。 1.2 指令微调 执行run_clm_sft_with_peft 1.3 合并LORA 大模型的原始参数和微调后的参数...
-
快速识别你家的猫猫狗狗,教你用ModelBox开发AI萌宠应用
本文分享自华为云社区《ModelBox-AI应用开发:动物目标检测【玩转华为云】》,作者:阳光大猫。 一、准备环境 ModelBox端云协同AI开发套件(Windows)环境准备【视频教程】 二、应用开发 1. 创建工程 在Model...
-
【机器学习】使用Stable Diffusion实现潜在空间搜索
1、引言 1.1 潜在空间的概念 潜在空间(Latent Space)是在机器学习和深度学习中一个重要的概念,它指的是用于表示数据的一种低维空间。这个空间编码了数据中包含的所有有用信息的压缩表示,通常比原始数据空间的维数更低,从而使其更容易进行分析...
-
LLama的激活函数SwiGLU 解释
目录 Swish激活函数 1. Swish函数公式 LLaMA模型中的激活函数 1. SwiGLU激活函数 2. SwiGLU激活函数的表达式 3. SwiGLU激活函数的优势 Swish激活函数 Swish是一种激活函数,其计算...
-
stable diffusion官方版本复现
踩了一些坑,来记录下 环境 CentOS Linux release 7.5.1804 (Core 服务器 RTX 3090 复现流程 按照Stable Diffusion的readme下载模型权重、我下载的是stable-diffusio...
-
人工智能学习笔记(2):认识和安装Stable Diffusion
人工智能学习笔记(2):认识和安装Stable Diffusion 文章目录 人工智能学习笔记(2):认识和安装Stable Diffusion Stable Diffusion的起源和发展历程 Stable Diffusion的应用...
-
Stable Diffusion | Gradio界面设计及ComfyUI API调用
本文基于ComfyUI API编写了类似于webUI的Gradio交互式界面,支持文生图/图生图(SD1.x,SD2.x,SDXL,Stable Cascade),Lora,ControlNet,图生视频(SVD_xt_1_1),图像修复(FaceDeta...
-
【Xiao.Lei】- Copilot插件完全指南:提高开发效率的利器
引言 GitHub Copilot插件是由OpenAI开发的一款基于人工智能技术的开发助手,它能够理解你的代码上下文并为你提供实时的代码建议。本文将深入介绍Copilot插件的安装、配置以及详细使用,帮助你更好地利用这一强大工具提高开发效率。 第一...
-
[从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码:绝对位置、相对位置、旋转位置编码
[从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码 文章目录 [从0开始AIGC][Transformer相关]:一文看懂Transformer中的位置编码 1. 位置编码 1.1 绝对位...
-
阿里AI代码智能编辑插件通义灵码——对标GitHub Copilot、完爆讯飞iflycode
前言 本人亲测,阿里的通义灵码比讯飞的iflycode好用,好用不知道多少倍。 !!!!!声明,我没有收钱,亲身感受。 官网 通义灵码官网地址:https://tongyi.aliyun.com/lingma/ 下载使用 按照官网给出的步...
-
transformers 阅读:Llama 模型
正文 学习一下 transformers 库中,Llama 模型的代码,学习过程中写下这篇笔记,一来加深印象,二来可以多次回顾。 笔者小白,里面错误之处请不吝指出。 层归一化 LlamaRMSNorm transformers 中对于 Llam...
-
上手GitHub Copilot让AI写代码,效率飞起!
1 GitHub Copilot介绍 GitHub Copilot 由 GitHub 和 OpenAI 共同开发的人工智能代码辅助工具,可自动地生成高质量代码片段、上下文信息等。通过自然语言处理和机器学习技术,通过分析程序员编写的代码、注释和上下文信息...
-
探索Whisper Streaming:实时语音转文本的高效解决方案
探索Whisper Streaming:实时语音转文本的高效解决方案 项目地址:https://gitcode.com/ufal/whisper_streaming Whisper Streaming 是一个强大的开源项目,由捷克布尔诺科技大学UF...
-
AIGC系列之:GroundingDNIO原理解读及在Stable Diffusion中使用
目录 1.前言 2.方法概括 3.算法介绍 3.1图像-文本特征提取与增强 3.2基于文本引导的目标检测 3.3跨模态解码器 3.4文本prompt特征提取 4.应用场景 4.1结合生成模型完成目标区域生成 4.2结合stable di...
-
探索深度学习艺术:Stable Diffusion的ONNX & FP16革命
探索深度学习艺术:Stable Diffusion的ONNX & FP16革命 项目地址:https://gitcode.com/Amblyopius/Stable-Diffusion-ONNX-FP16 在当今的艺术与技术交汇处,一个令人兴奋...
-
AI绘画专栏之Stablediffusion webui Controlnet SDXL 插件之segment-anything(40)
1.是什么 分割任何物体模型,还记得语义分割和镜头风格词库,这个原理就是根据语义分割做的词库 ## [2024最全大厂面试题无需C币点我下载或者在网页打开全套面试题已打包](https://pan.quark.cn/s/865a0bbd5...
-
大模型算法(一):从Transformer到ViT再到LLaMA
单任务/单领域模型 深度学习最早的研究集中在针对单个领域或者单个任务设计相应的模型。 对于CV计算机视觉领域,最常用的模型是CNN卷积模型。其中针对计算机视觉中的不同具体任务例如分类任务,目标检测任务,图像分割任务,以CNN作为骨干backbone,加...
-
代码高手的过节秘籍:CodeArt Snap帮写代码,灵感弹指间实现
本文分享自华为云社区《【端午特辑】代码高手的过节秘籍:CodeArt Snap帮写代码,灵感弹指间实现》,作者: 华为云社区精选。 端午将至,粽叶飘香,你却还在为一行行代码头疼?与bug缠斗不休? 现在,基于盘古大模型技术打造的华为云智能开发助手Cod...
-
AIGC学习(SD、LoRA和ControlNet)
目录 Stable Diffusion(稳定扩散模型) 为什么叫扩散模型? 网络结构 VAE(Variational Auto-Encoder) UNet模型 CLIP Text Encoder LoRA(低秩适应矩阵 什么是LoRA?...
-
五一 Llama 3 超级课堂 | XTuner 微调 Llama3 图片理解多模态 实践笔记
基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。 课程文档:Llama3-Tutorial/docs/llava.md at main · Smart...
-
谷歌推出全新AI代码辅助工具Code Assist,挑战GitHub Copilot|TodayAI
在其Cloud Next大会上,谷歌推出了一款名为Code Assist的AI驱动代码完成工具。该工具原名为Duet AI,现增强了功能并与流行的编辑器兼容。 Code Assist不仅与GitHub的Copilot Enterprise直接竞争,还以百...