-
【国产异构加速卡】基于llama.cpp实现Llama3模型的guff格式转换、4bit量化以及推理加速
重要说明:本文从网上资料整理而来,仅记录博主学习相关知识点的过程,侵删。 序言 本文使用llama.cpp框架,对 Llama3-8B-Instruct 模型进行gguf格式转换,8bit量化,并在CPU和GPU上对8bit模型进行推理。 测试平台...
-
【Datawhale X 魔搭 AI夏令营】AIGC方向——Task02笔记GC
Task02 AI生图技术 为什么要了解AI生图前沿? AI生图的历史 AI生图的难点和挑战有哪些? 精读baseline代码(上次运行的) 再次生成图片 AI生图技术 为什么要了解AI生图前沿? AIGC(AI-Gene...
-
TaskWhisperer 使用教程
TaskWhisperer 使用教程 taskwhispererTaskwhisperer is a extension for TaskWarrior Application https://taskwarrior.org. It is to dis...
-
#Datawhale X 魔搭 AI 夏令营# AIGC文生图 Task2
1. 什么是AI生图 一般来说,AI生图模型属于多模态机器学习模型,通过海量的图库和文本描述的深度神经网络学习,最终的目标是可以根据输入的指示(不管是文本还是图片还是任何 生成符合语义的图片。 通俗来说,AI生图模型获得图片生成能力主要是通过 学习 图...
-
openai whisper使用
whisper使用 介绍 Whisper是一种通用的语音识别模型。它是在大量不同音频数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 GitHub:https://github.com/openai/whisper...
-
开源项目 PaperWhisperer 指南
开源项目 PaperWhisperer 指南 paperwhispererAutomatic voice-synthetised summaries of latest research papers on arXiv项目地址:https://gitc...
-
使用亚马逊Bedrock的Stable Diffusion XL模型实现文本到图像生成:探索AI的无限创意
引言 什么是Amazon Bedrock? Amazon Bedrock是亚马逊云服务(AWS)推出的一项旗舰服务,旨在推动生成式人工智能(AI)在各行业的广泛应用。它的核心功能是提供由顶尖AI公司(如AI21 Labs、Anthropic、Cohere...
-
Sora陷研究泥潭?OpenAI一年血亏50亿,高盛报告乌龙引AI股地震!
刚刚,外媒曝出:Sora陷入了研究困境!背后原因,就是安全风险以及与好莱坞的合作。另外,最近高盛的报告错误解读了ChatGPT流量下降,直接引爆市场的恐慌情绪,导致AI股票纷纷被抛售。 Sora深陷研究困境? Sora在今年二月发布后,至今还是「期货」,为...
-
基于云原生向量数据库 PieCloudVector 的 RAG 实践
近年来,人工智能生成内容(AIGC)已然成为最热门的话题之一。工业界出现了各种内容生成工具,能够跨多种模态产生多样化的内容。这些主流的模型能够取得卓越表现,归功于创新的算法、模型规模的大幅扩展,以及海量的高质量数据集。然而 AIGC 依然面临一系列挑战,检...
-
【愚公系列】《AIGC辅助软件开发》013-AI辅助客户端编程:AI辅助 iOS 应用开发
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task01笔记
赛题内容 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度...
-
ACL 2024 | CoCA:自注意力的缺陷与改进
近年来,在大语言模型(LLM)的反复刷屏过程中,作为其内核的 Transformer 始终是绝对的主角。然而,随着业务落地的诉求逐渐强烈,有些原本不被过多关注的特性,也开始成为焦点。例如:在 Transformer 诞生之初,被视为天然具备的长度外推能力,...
-
Datawhale X 魔搭 AI夏令营‣AIGC文生图方向-Task2笔记
目录 一、用AI的prompts进行AI文生图 ‣通义千问 ‣跑baseline ‣结果展示: ‣另,prompts风格补充: 三、精读baseline ‣原始代码详情 ‣分析代码的主题架构 & 分析代码的主题...
-
【diffusers极速入门(七)】Classifier-Free Guidance (CFG)直观理解以及对应代码
系列文章目录 【diffusers 极速入门(一)】pipeline 实际调用的是什么? call 方法! 【diffusers 极速入门(二)】如何得到扩散去噪的中间结果?Pipeline callbacks 管道回调函数 【diffusers极速...
-
最新口型同步技术EchoMimic部署
EchoMimic是由蚂蚁集团推出的一个 AI 驱动的口型同步技术项目,能够通过人像面部特征和音频来帮助人物“对口型”,生成逼真的动态肖像视频。 EchoMimic的技术亮点在于其创新的动画生成方法,它不仅能够通过音频和面部关键点单独驱动图像动画,还能结...
-
lit-llama代码解析
https://github.com/Lightning-AI/lit-llama/blob/main/README.md 下载的时候会报错误,因为网不行,一种方法就是多次尝试,另一种方法是终端连上代理下载 pycharm连接hugging fac...
-
【Datawhale X 魔搭 AI夏令营】第四期 AIGC方向 学习笔记
零基础30分钟速通文生图 一、开通阿里云PAI-DSW试用 1、开通阿里云免费试用 链接:https://free.aliyun.com/?productCode=learn 2、在魔搭社区进行授权 链接:https://www.models...
-
Datawhale X 魔搭 第四期 AIGC文生图方向-Task03笔记
Hello,各位小伙伴们,继上一次我们精读并跑通了baseline2后,我们对AIGC文生图方向又有了更进一步的了解。今天呢我们实现AIGC方向的进阶上分,还在犹豫什么,还不快快行动起来~ 好,话不多说,今天我们就来聊聊ComfyUI和Lora微调吧~...
-
【愚公系列】《AIGC辅助软件开发》002-AI智能化编程助手:GitHub Copilot
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
中间旅程机器人教程:基于sandarutharuneth的midjourney-bot
中间旅程机器人教程:基于sandarutharuneth的midjourney-bot midjourney-botA opensource Discord Midjourney bot for all AI lovers. No more paywa...
-
Stable Diffusion WebUI 简体中文翻译扩展教程
Stable Diffusion WebUI 简体中文翻译扩展教程 stable-diffusion-webui-localization-zh_CNSimplified Chinese translation extension for AUTOMA...
-
node-llama-cpp 使用与安装指南
node-llama-cpp 使用与安装指南 node-llama-cppRun AI models locally on your machine with node.js bindings for llama.cpp. Force a JSON s...
-
浅谈AIGC的底层技术
人工智能生成内容(Artificial Intelligence Generated Content, 简称AIGC)是近年来AI技术发展的一个重要领域,它利用机器学习和自然语言处理等技术,让计算机能够自主创作文章、音乐、图像等多种类型的内容。本文将深入浅...
-
第三十五篇-各大模型测评地址和说明集合
1.Open LLM Leaderboard - 开放式LLM排行榜 测评地址:https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard 说明:使用Eleuther...
-
独家|河马爱学并入豆包,字节打造AI产品全家桶
Tech星球独家获悉,字节跳动大力教育旗下的AI教育App河马爱学,已于近期正式更名为“豆包爱学”,成为豆包旗下首个以豆包命名的App。 Tech星球独家了解到,河马爱学此前由大力教育ZERO团队负责,该团队在国内主要是研究AI教育,今年上半年,由于业务...
-
探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork
探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork llama-cpu项目地址:https://gitcode.com/gh_mirrors/ll/llama-cpu 在人工智能的广阔领域中,语言模型的进步一直是推动技术前沿的...
-
OpenVINO版Stable Diffusion教程
OpenVINO版Stable Diffusion教程 stable_diffusion.openvino项目地址:https://gitcode.com/gh_mirrors/st/stable_diffusion.openvino 项目介绍...
-
Prompt-hunter:一键保存Midjourney细节页面至Notion的高效工具
Prompt-hunter:一键保存Midjourney细节页面至Notion的高效工具 Prompt-hunterSave the Prompt and images from the Midjourney details page to your...
-
stable Diffusion 网页用户界面 github
稳定的 Diffusion 网页用户界面 使用 Gradio 库实现的稳定扩散的 Web 界面。 特征 带有图片的详细功能展示: 原始的 txt2img 和 img2img 模式 一键安装并运行脚本(但您仍然必须安装 pyth...
-
HID-Joy-Con-Whispering 项目使用教程
HID-Joy-Con-Whispering 项目使用教程 HID-Joy-Con-WhisperingTalk to Joy-Con from a PC because it's cool项目地址:https://gitcode.com/gh_mir...
-
Lag-Llama:时间序列预测的开源基础模型中文安装与使用指南
Lag-Llama:时间序列预测的开源基础模型中文安装与使用指南 lag-llamaLag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting项目地址:h...
-
AI日报:Claude企业版上线;支付宝外滩大会将推支小宝等3款AI产品;Soul语音大模型惊艳到我了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Anthropic发布企业版A...
-
Datawhale X 魔搭 AI夏令营AIGC方向task2
第一步:安装 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip unins...
-
ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型
OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...
-
使用PyTorch从零构建Llama 3
我们上次发了用PyTorch从零开始编写DeepSeek-V2的文章后,有小伙伴留言说希望介绍一下Llama 3。那么今天他就来了,本文将详细指导如何从零开始构建完整的Llama 3模型架构,并在自定义数据集上执行训练和推理。 [图1]:Llama...
-
WhisperX: 带时间戳的自动语音识别及说话人分离
WhisperX: 带时间戳的自动语音识别及说话人分离 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,...
-
使用OpenAI Whisper的说话人识别管道
使用OpenAI Whisper的说话人识别管道 whisper-diarizationAutomatic Speech Recognition with Speaker Diarization based on OpenAI Whisper项目地址:...
-
大模型之二十七-语音识别Whisper实例浅析
Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预训练模型,而large-v3的标注数据超过了500万小时,其...
-
AIGC初体验 Datawhale X 魔搭夏令营
跟DataWhale的步骤跑通baseline 环境安装 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch...
-
Distil-Whisper 开源项目教程
Distil-Whisper 开源项目教程 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% wor...
-
LongLLaMA:扩展上下文处理能力的大型语言模型
LongLLaMA:扩展上下文处理能力的大型语言模型 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on Ope...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
京东的AIGC革新之旅:通过JoyCoder实现研发提效 | 新程序员
【导读】从需求分析、设计编码到测试运维,AI已经逐步渗透到软件开发的各个环节,如何切实针对研发场景进行提效,是业内每个企业都在思考的问题。本文作者详细分析了AI在研发中的实际应用,并分享了JoyCoder与京东内部工具结合的实际案例,展示了AI...
-
推荐项目:Hugo Whisper 文档主题
推荐项目:Hugo Whisper 文档主题 hugo-whisper-themeWhisper is a minimal documentation theme for Hugo.项目地址:https://gitcode.com/gh_mirrors...
-
【扩散模型(六)】Stable Diffusion 3 diffusers 源码详解1-推理代码-文本处理部分
系列文章目录 【扩散模型(一)】中介绍了 Stable Diffusion 可以被理解为重建分支(reconstruction branch)和条件分支(condition branch) 【扩散模型(二)】IP-Adapter 从条件分支的视角,快...
-
python从入门到精通:基础语法讲解
1、字面量 字面量:在代码中,被写下来的固定的值,称之为字面量。 python中常用的几种数据类型: 类型 描述 说明 数字(Number) 整数(int) 浮点数(float) 复数(complex) 布尔(bool) 整数(int)...
-
Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南
Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南 stable-diffusion-webui-Prompt_Generator项目地址:https://gitcode.com/gh_mirrors/st/...
-
如何申请 Midjourney API ,看这篇文章就够了
如何申请 Midjourney API ,看这篇文章就够了 Midjourney 是一款非常强大的 AI 绘图工具,只要输入关键字,就能在短短一两分钟生成十分精美的图像。Midjourney 以其出色的绘图能力在业界独树一帜,如今,Midjourney...
-
WebLlama 项目使用教程
WebLlama 项目使用教程 webllamaLlama-3 agents that can browse the web by following instructions and talking to you项目地址:https://gitcod...
-
Datawhale X 魔搭 AI夏令营 第四期AIGC_task03笔记
工具初探一ComfyUI 认识ComfyUI ComfyUI 是"Graphical User Interface"(图形用户界面)的缩写,简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI 是GUI的一种,是...