-
OpenAI 开源的免费 AI 语音转文字工具 - Whisper,一步一步本地部署运行
Whisper 是 OpenAI 研发的一个通用的语音识别模型,可以把语音转为文本。它在大量多样化的音频数据集上进行训练,同时还是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 一、使用场景 语音 => 文字 是一个非常实用的功能,...
-
Stable Diffusion初级教程
一、入门篇 1. 理解基本概念 扩散模型(Diffusion Models):扩散模型是一种生成模型,通过逐步添加噪声到数据样本中,然后学习如何逐步去除这些噪声来恢复原始数据。 Latent Diffusion Model (LDM :LDM是...
-
OpenAI Whisper 语音转文本实验
为了实现语音方式与大语言模型的对话,需要使用语音识别(Voice2Text)和语音输出(Text2Voice)。感觉这项技术已比较成熟了,国内也有许多的机构开发这项技术,但是像寻找一个方便测试的技术居然还不容易。Google 墙了,微...
-
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练
大神Karpathy已经不满足于用C语言造Llama了! 他给自己的最新挑战:复现OpenAI经典成果,从基础版GPT-2开始。 挑战成功本身并不意外,但是只花费20美元、90分钟完成训练,Loss和评测还超越原版,就!有!点!过!分!了!。 不仅如此,...
-
谷歌搜索算法内幕被扒,2500页巨细文件实名泄密!搜索排名谎言被揭穿
日前,谷歌2500页的内部文档被泄露,揭示了搜索——「互联网最强大的仲裁者」的运作方式。 爆料人是SparkToro的联合创始人兼CEO,他在自家网站上发表博客文章,宣称「一位匿名人士与我分享了数千页泄露的谷歌搜索API文档,SEO中的每个人都应该看到它...
-
【ollama】(2):在linux搭建环境,编译ollama代码,测试qwen大模型,本地运行速度飞快,本质上是对llama.cpp 项目封装
关于 ollama 项目 https://github.com/ollama/ollama/tree/main/docs https://www.bilibili.com/video/BV1oS421w7aM/ 【ollama】(2...
-
手把手教你基于华为云,实现MindSpore模型训练
本文分享自华为云社区《【昇腾开发全流程】MindSpore华为云模型训练》,作者:沉迷sk。 前言 学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。 并打通一个Ascend910训练到Ascend310推理的全流程...
-
利用AI秒去水印,移除不想要的内容|【Stable Diffusion】实战篇
最近有老铁询问如何将图片中不想要的内容去掉,当然你可以用PS来操作,但是这可能会占用你不少时间。今天我给大家介绍一款SD插件,可以秒去要移除的内容,并且效果上来看还是很不错的。它就是——cleaner插件。 插件和模型地址文末获取~ 插件快速安装...
-
AI丨部署SadTalker并添加到Stable Diffusion
前言 Stable Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。 如何配置Stable Diffusion部署本地A...
-
Yolov10:详解、部署、应用一站式齐全!
一、前言 在过去的几年里,YOLOs由于其在计算成本和检测性能之间的有效平衡,已成为实时目标检测领域的主导范式。研究人员探索了YOLO的架构设计、优化目标、数据扩充策略等,取得了显著进展。然而,依赖非极大值抑制(NMS)进行后处理阻碍了YOLO的...
-
Meta的 Llama-3 在线使用与下载
前言 2024年4月19日,全球社交巨头Meta在他们的官网,正式发布了开源大模型 Llama-3 !! 该版本包括预训练和指令调整的 Llama 3 语言模型的模型权重和起始代码 - 包括 8B 到 70B 参数! 简介 Llama 3 在 2...
-
大模型培训老师叶梓 AI编程的未来:GitHub Copilot的创新之旅与实践智慧
GitHub Copilot 是一个由 GitHub 开发的先进工具,它利用大语言模型(LLM)来辅助开发者编写代码。这个工具的开发和成功部署为其他希望构建企业级 LLM 应用的团队提供了宝贵的经验。以下是根据提供的文献,对 GitHub Copilot...
-
比较AI编程工具Copilot、Tabnine、Codeium和CodeWhisperer
主流的几个AI智能编程代码助手包括Github Copilot、Codeium、Tabnine、Replit Ghostwriter和Amazon CodeWhisperer。 你可能已经尝试过其中的一些,也可能还在不断寻找最适合自己或公司使用的编程助手...
-
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) #Options local_llm = 'llama3' llm = ChatOllama(model=local_llm, format="json", tempe...
-
AIGC趋势下软件工程强智能编码来临了么?
一、背景 在AIGC(AI Generated Content,人工智能生成内容)的趋势下,软件工程领域的“强智能编码”是指通过深度学习、自然语言处理等前沿技术,使AI具备理解、学习、推理和生成代码的能力,从而实现自动化或半自动化的程序开发。这种技术能够...
-
Stable Diffusion Web部署报错解决-Windows
项目地址:GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI 教程:GitHub-Automatic Installation on Windows 报错:...
-
不影响输出质量还能追踪溯源,「大模型无偏水印」入选ICLR 2024 Spotlight
本文通讯作者为马里兰大学计算机系的博士生胡正冕,其导师为 Heng Huang。他的主要研究方向是采样与机器学习理论,曾在ICML、NeurIPS、ICLR等顶级会议上发表多篇论文。邮箱: huzhengmian@gmail.com 随着大语言模型(LL...
-
国产开源Sora上新:全面支持国产AI算力,可用ReVideo视频编辑,北大-兔展团队出品
北大-兔展联合发起的Sora开源复现计划Open-Sora-Plan,今起可以生成最长约21秒的视频了! 生成的视频水平,如下展示。先看这个长一点的,9.2s: 当然了,老规矩,这一次的所有数据、代码和模型,继续开源。 目前,Open-Sora-Plan在...
-
Llama 3 安装使用方法
Llama3简介: llama3是一种自回归语言模型,采用了transformer架构,目前开源了8b和70b参数的预训练和指令微调模型,400b正在训练中,性能非常强悍,并且在15万亿个标记的公开数据进行了预训练,比llama2大了7倍,距离llam...
-
Llama 3 五一超级课堂中实践llama3的部署,微调,量化优化部署学习总结:第一部分llama3部署
本次学习分享基于Llama3-Tutorial(Llama 3 超级课堂)分享,git地址如下 GitHub - SmartFlowAI/Llama3-Tutorial: Llama3-Tutorial(XTuner、LMDeploy、OpenCompa...
-
高亮反光终结者?谷歌NeRF-Casting:光线追踪就能搞定!
NeRF不再“畏惧”近处高光反射 早期的NeRF变体使用多层感知器(MLPs)从三维坐标映射到体积密度和视点相关的颜色,但是表示详细的三维几何和颜色所需的大型MLPs训练和评估速度极慢。最近的工作专注于通过用类似体素网格的数据结构或网格和小型MLPs的组...
-
【AIGC调研系列】CogVLM2:第二代视觉大模型
CogVLM2是智谱AI推出的新一代多模态大模型,继承并优化了上一代模型的经典架构。CogVLM2采用了一个拥有50亿参数的强大视觉编码器,并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块[1]。这一设计使得CogVLM2在视觉和语言理解方面实现...
-
Llama 3 实践教程(InternStudio 版)
文章目录 Llama3本地 Web Demo部署 初始环境配置 下载模型 Web Demo 部署 XTuner 微调 Llama3 个人小助手 自我认知训练数据集准备 XTuner配置文件准备 训练模型 推理验证 XTuner微调Lla...
-
众神听令,王者归位!Meta最强开源大模型 Llama 3 重磅来袭
整理 | 王轶群 责编 | 唐小引 出品丨AI 科技大本营(ID:rgznai100) 4月19日凌晨,Meta重磅发布了全球最大开源大模型Llama 3,一夜间重新坐稳王者之位。 模型下载链接:https://llama.meta.com/lla...
-
LLaMA-Factory+qwen多轮对话微调测评
目录 训练的时间和效果 数据准备 数据样例 数据配置 环境搭建 模型微调训练 模型预测 运行成功的web UI LLaMA-Factory地址:https://github.com/hiyouga/LLaMA-Factory/blo...
-
Stable Diffusion XL优化终极指南
如何在自己的显卡上获得SDXL的最佳质量和性能,以及如何选择适当的优化方法和工具,这一让GenAI用户倍感困惑的问题,业内一直没有一份清晰而详尽的评测报告可供参考。直到全栈开发者Félix San出手。 在本文中,Félix介绍了相关...
-
一文读懂 Arthur Bench LLM 评估框架
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估 。 众所周知,LLM 评估是人工智能领域的一个重要议题。随着 LLM 在各个场景中的广泛应用,评估它们的能力和局限性变得越来越重要。作为一款新兴...
-
手把手教你如何开通GitHub Copilot并且在vscode中使用
很多小伙伴应该已经知道Copilot的鼎鼎大名了,也有一些白嫖怪白嫖了3个月免费试用期后找不到续费的渠道,今天就给大家献上一篇续费/开通Copilot的文章; 1.首先登录git: git; 以及fomepay 2.点击头像->Copil...
-
midjourney-proxy-plus搭建教程
目录 0.演示环境 1.创建Midjourney网页 2.搭建mj代理地址 3.创建目录文件 4.同步和开放数据库端口 5.拉取镜像 6.创建容器 0.演示环境 CentOS 8 宝塔8.0 Nginx >= 1.19....
-
10分钟Window本地部署stable diffusion AI绘图【入门教程(1)
2、下载模型 下载AI模型,用于生成图片的模型,该官网需要注册才能下载,大家自行注册下载就行,我这边下载的1.4版本的。此模型有4G,下载比较慢。 下载后把名字改为:model.ckpt,并放入文件夹stable-diffusion-main/mode...
-
免费AI出图神器:StableStudio——定义AI作画新前景
StableStudio:探索艺术与科技的无限交界,StableStudio引领AI智能创作新浪潮! - 精选真开源,释放新价值。 概览 ChatGPT大语言模型AI的诞生引爆了对AIGC的讨论。AIGC 又称生成式 AI (Generat...
-
【带文字的图像生成-附开源代码】AIGC 如何在图像中准确生成文字?字体篇(上)
文字图像生成是什么? “文字图像生成(Text-image generation)”即生成带有指定文字的图像。如下图所示,市面常见的通用文生图很难准确地生成带有指定文字的图像。文字图像生成也被称为文本渲染(Text rendering)。 为什么重要?...
-
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体
当前,多模态大模型 (MLLM)在多项视觉任务上展现出了强大的认知理解能力。 然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。 比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。 定位能力的缺失直接限制了多模态...
-
模块化重构LLaVA,替换组件只需添加1-2个文件,开源TinyLLaVA Factory来了
TinyLLaVA 项目由清华大学电子系多媒体信号与智能信息处理实验室 (MSIIP 吴及教授团队和北京航空航天大学人工智能学院黄雷老师团队联袂打造。清华大学 MSIIP 实验室长期致力于智慧医疗、自然语言处理与知识发现、多模态等研究领域。北航团队长期...
-
自定义数据集使用llama_factory微调模型并导入ollama
本文所有操作均在linux系统下完成 llama_factory安装 参考github的安装命令 git clone https://github.com/hiyouga/LLaMA-Factory.git conda create -n llama...
-
YOLOv10来啦!真正实时端到端目标检测
本文经自动驾驶之心公众号授权转载,转载请联系出处。 过去几年里,YOLOs因在计算成本和检测性能之间实现有效平衡而成为实时目标检测领域的主流范式。研究人员针对YOLOs的结构设计、优化目标、数据增强策略等进行了深入探索,并取得了显著进展。然而,对非极大...
-
教程:利用LLaMA_Factory微调llama3:8b大模型
一、安装llama模型文件 下载地址(魔塔):https://modelscope.cn/models/LLM-Research/Meta-Llama-3-8B-Instruct/files 点击下载模型,复制git命令: git clone htt...
-
【Stable Diffusion系列】(一):AI绘画本地部署教程
目录 一、总览 二、本地部署 1、安装cuda 2、安装python 3、安装git 4、方法一 1)获取安装包 2)update 3)run 5、方法二 1)git clone 2)双击webui-user.bat 3)更...
-
LLM大模型推理加速实战:vllm、fastllm与llama.cpp使用指南
随着人工智能技术的飞速发展,大型语言模型(LLM)在诸如自然语言处理、智能问答、文本生成等领域的应用越来越广泛。然而,LLM模型往往具有庞大的参数规模,导致推理过程计算量大、耗时长,成为了制约其实际应用的关键因素。为了解决这个问题,一系列大模型推理加速工具...
-
Stable Diffusion WebUI 中调度器(Schedule type)简单研究
?内容概要 在近期,stable diffusion webui更新了1.9版本,其中包含的一项变化就是,把采样器和调度器(Schedule type)分开了,之前是合并在一起来选择的,所以这篇文章主要分两个部分,第一个部分是作者为什么把他们给分开了,第...
-
Shortened LLaMA:针对大语言模型的简单深度剪枝法
? CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 论文标题 & 发表会议:Shortened LLaMA: A Simple Depth Pruning for Large Language Model...
-
MacOS使用ollama部署codellama+openui以及llama.cpp部署
现在AI这么火,你是不是也渴望能够在本地部署并运行属于自己的大模型,然而,高昂的硬件成本又往往成了一大障碍,限制了你继续在AI领域去探索和创新。如果告诉你,无需换电脑,无需额外花钱买GPU或换显卡,你现在的电脑就可以本地跑一些大模型,那将是多么酷的一...
-
手把手教你用LoRA训练自己的Stable Diffusion模型
目录 写在前面 一、准备数据 二、数据打标签 三、执行训练 四、执行推理 1.LoRA推理 2.全参数推理 写在前面 Stable Diffusion大家已经很熟悉了,那么如何训练自己的sd模型呢,今天我就介绍一下用L...
-
Llama模型下载
最近llama模型下载的方式又又变了,所以今天简单更新一篇文章,关于下载的,首先上官网,不管在哪里下载你都要去官网登记一下信息:https://llama.meta.com/llama2 然后会出现下面的信息登记网页: 我这里因为待业所以or...
-
在Mac电脑上本地部署Llama大型语言模型
Llama大型语言模型以其出色的性能和广泛的应用场景,吸引了众多NLP研究者和开发者的关注。在Mac电脑上本地部署Llama模型,可以让我们更加便捷地利用这一强大工具进行各种NLP任务。本文将详细介绍在Mac电脑上本地部署Llama模型的步骤和注意事项。...
-
stable-diffusion-webui安装与使用过程中的遇到的error合集
stable-diffusion-webui1.9.2踩坑安装 1. 安装过程 1.1 stable-diffusion-webui 1.2 在win11或win10系统安装,需修改两个启动脚本 1.2.1 修改webui-user.bat...
-
Copilot Workspace是GitHub对人工智能驱动的软件工程的诠释
软件开发的未来是人工智能驱动的集成开发环境吗?至少GitHub 是这样想的。 在今年初秋于旧金山举行的 GitHub Universe 年度大会之前,GitHub 发布了 Copilot Workspace,这是一种开发环境,利用 GitHub 所称的...
-
1panel+MaxKB+Ollama+Llama Linux部署指南
目录 1.1panel安装 2.MaxKB 1.MaxKB登录 3.Ollama(gpu)安装 1.安装英伟达容器安装包 1.配置apt源 2.更新源 3.安装工具包 2.使用GPU运行...
-
Llama 3 Agent 能力体验+微调
Llama 3 Agent 能力体验+微调(Lagent 版) 微调过程 本次实验基于AutoDL平台使用A40显卡做的实验,使用 XTuner 在 Agent-FLAN 数据集上微调 Llama3-8B-Instruct,以让 Llama3-8B...
-
最简单的Stable Diffusion 本地部署教程
为了在本地成功部署Stable Diffusion,你需要遵循一系列详细的步骤,确保所有必要的硬件和软件环境都被正确配置。以下是一个全面的教程,帮助你从零开始搭建Stable Diffusion的运行环境。 1. 硬件和软件环境准备【1】【5】 在开...