-
Datawhale AI夏令营第四期的学习活动—AIGC Task3笔记
目录 一、工具初探一ComfyUI应用场景探索 1.初识ComfyUI 1.1 什么是ComfyUI 1.2 ComfyUI核心模块 1.3 ComfyUI图片生成流程 1.4 ComfyUI的优势 2.20分钟速通安装ComfyUI...
-
探索音频转文字的高效之道:whisper-rs项目解析与应用
探索音频转文字的高效之道:whisper-rs项目解析与应用 whisper-rsRust bindings to https://github.com/ggerganov/whisper.cpp项目地址:https://gitcode.com/gh_...
-
全球3.5亿下载量破纪录! Llama家族暴涨10倍,开源帝国掀AI革命
【新智元导读】诞生一年半,Llama家族早已稳坐开源界头把交椅。最新报告称,Llama全球下载量近3.5亿,是去年同期的10倍。而模型开源让每个人最深体会是,token价格一降再降。 Llama一举成为世界开源的领头羊。 截至目前,Llama模型在开源平台...
-
从零开始快速使用comfyUI进行文生图或者图生视频制作
前言 今天花时间试了试怎么用 ComfyUI,今天晚上就来介绍一下,怎么简单使用。 上面是用 comfyUI 生成的视频。 安装 首先进行安装。 在 github 上搜索 comfyUI,第一个就是,点进去然后点击左侧 Release...
-
阿里重磅开源Qwen2-VL:能理解超20分钟视频,媲美GPT-4o!
阿里巴巴开源了最新视觉多模态模型Qwen2-VL,根据测试数据显示,其72B模型在大部分指标超过了OpenAI的GPT-4o,Anthropic的Claude3.5-Sonnet等著名闭源模型,成为目前最强多模态模型之一。 Qwen2-VL支持中文、英文、...
-
Datawhale AI夏令营第四期AIGC-3进阶上分-实战优化
Task3学习链接 Datawhale (linklearner.com 1. ComfyUI的安装与使用 ComfyUI 是GUI"Graphical User Interface"(图形用户界面)的一种,是基于节点工作的用户界面,主要用于操作图...
-
ViT篇外:NVIDIA Llama-3.1-Minitron 4B
相关阅读: ViT:3 Compact Architecture MobileLLM:“苗条”的模型比较好! 大家也许会很好奇为什么在ViT章节插入了NVIDIA Llama-3.1-Minitron 4B,ViT因为应用场景的特殊性所以都寄...
-
开源项目:Stable Diffusion Prompt Reader 教程
开源项目:Stable Diffusion Prompt Reader 教程 stable-diffusion-prompt-readerstable-diffusion-prompt-reader - 一个简单的独立查看器,用于在Web UI外部读取...
-
AIGC——微调技术(Datawhale X 魔搭 Al夏令营)
微调(Fine-tuning)是一种在深度学习和机器学习领域中常用的技术,旨在通过调整预训练模型的参数来使其更好地适应特定任务。其基本原理和参数的理解对于实现更好的效果至关重要。 前言 了解微调的基本原理,对微调的各种参数有一个更加清楚的了解,...
-
Stable Diffusion 开源项目教程
Stable Diffusion 开源项目教程 stablediffusionHigh-Resolution Image Synthesis with Latent Diffusion Models项目地址:https://gitcode.com/gh...
-
llama.cpp使用
llama.cpp的github库地址为ggerganov/llama.cpp: LLM inference in C/C++ (github.com ,具体使用以官方说明为准。 简介 llama.cpp目标是在本地和云端的各种硬件上以最小的设置和最...
-
Datawhale AI夏令营第四期魔塔-AIGC文生图方向 task03笔记
目录 一、工具初探一ComfyUI应用场景探索 1.初识ComfyUI 2.20分钟速通安装ComfyUI 3.浅尝ComfyUI工作流 二、Lora微调 1.Lora简介 2.Lora详解 一、工具初探一ComfyUI应用场景...
-
Whisper-TikTok 使用指南
Whisper-TikTok 使用指南 Whisper-TikTokFrom AI tools to TikTok video creation using FFMPEG, Microsoft Edge read aloud and OpenAI Wh...
-
ComfyUI基础篇:Windows系统安装ComfyUI方法
ComfyUI作为一款功能强大的AI生图工具,它通过节点方式,使用户可以直观地看到各个模块的功能,并根据需求进行调整和连接。这种方法使工作流程更加清晰,同时降低了使用门槛,使得不熟悉代码的用户也能轻松使用。本文记录ComfyUI在Windows的安装方法。...
-
Datawhale X 魔搭 AI夏令营 第四期--AIGC文生图 task2笔记
先上图看连环画成果 一直有个篮球总冠军,根据通义千问的文生图对话式生成8个连贯的文生图故事。通过生成的故事内容生成了下面的图片 男主正在练习打篮球 动漫风,连环画,一个黑色高个子帅气男生,穿着红色篮球服,正在篮球训练场上,练习投篮,专注地重复...
-
在LangChain中使用Llama.cpp:从安装到实践
在LangChain中使用Llama.cpp:从安装到实践 引言 Llama.cpp是一个高效的C++库,用于在CPU上运行大型语言模型(LLMs)。本文将介绍如何在LangChain中集成和使用Llama.cpp,包括安装、设置以及使用LLM和嵌...
-
Stable diffusion ComfyUI: 手把手教AutoDL 云主机部署 (上)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、注册账号 二、部署云主机 三、主机配置 四、文件传输 总结 前言 有些小伙伴总问我使用ComfyUI的最低配置是什么?我只能说推荐3...
-
Clara Copilot 开源项目教程
Clara Copilot 开源项目教程 clara-copilotA alternative to Github Copilot for vscode until you get the access to github copilot项目地址:ht...
-
ubuntu系统编译whisper.cpp/talk-llama
1. 项目克隆到本地 git clone https://github.com/ggerganov/whisper.cpp 2. 编译 CPU 版本: sudo apt-get install libsdl2-dev cd whisper.cpp...
-
Whisper-Streaming:实时语音转写与翻译的革命性工具
Whisper-Streaming:实时语音转写与翻译的革命性工具 whisper_streamingWhisper realtime streaming for long speech-to-text transcription and transl...
-
ChatGPT-Midjourney:一键拥有你的AI创作平台
🍭 ChatGPT-Midjourney:一键拥有你的AI创作平台 ChatGPT-Midjourney🍭 一键拥有你自己的 ChatGPT+Midjourney 网页服务 | Own your own ChatGPT+Midjourney web s...
-
Datawhale X 魔搭 AI夏令营 - AIGC文生图方向Task2笔记
今天做的是AIGC文生图方向的 task 2 ,回顾一下 task 2 step 0 : Task 2 学习规划 step 1 : 认识通义千问 (使用通义千问大语言模型学习如何借助AI智能助手帮我们阅读代码) 链接:点击直达 1...
-
GPT-5降临,代号猎户座?OpenAI疑用草莓训练,数学推理暴涨超越所有模型
OpenAI的下一代旗舰大语言模型,要来了? 据悉,新模型代号Orion(猎户座),就是能超越GPT-4的下一代模型。 而猎户座的预训练数据,正是由草莓模型生成的。 而草莓模型驱动的聊天机器人,很可能就会在今年秋天上线! 关于OpenAI的草莓,外媒The...
-
Bili.Copilot 开源项目教程
Bili.Copilot 开源项目教程 Bili.Copilot哔哩哔哩用户的个人助理项目地址:https://gitcode.com/gh_mirrors/bi/Bili.Copilot 项目介绍 Bili.Copilot 是一个基于开源技术构...
-
2024最新Stable Diffusion安装部署教程五分钟学会(附下载地址)
附上秋葉aaaki大佬整合包下载地址 👉下载地址24年8月最新 Stable Diffusion整合包v4.9(下载地址在文末)!三分钟入门AI绘画一、引言 在人工智能绘画领域,Stable Diffusion 无疑是一颗耀眼的明星。它能够根据文本描述生...
-
Datawhale X 魔搭 AI夏令营 Task1
Datawhale X 魔搭 AI夏令营 Task1 赛事解读 AI文生图相关概念 可图模型及微调简介 魔搭零代码生图、微调工具介绍 魔搭AI生图相关应用介绍 DataWhale开源组织网站主页:Datawhale DataWhaleAI夏令营第...
-
AI换脸,该抵制吗?
眼见≠为实,AI换脸欺骗了不少人。 前两天,湖北公安破获了一起用AI换脸技术解锁社交账号并倒卖获利的案件。不法分子通过AI换脸专门帮人解锁被平台冻结的交友账号,每解锁一个,收费15元-30元不等。该团伙共解冻了2107个账号,从中获利40万元。 有数据显示...
-
5分钟 Stable Diffusion 本地安装
5分钟 Stable Diffusion 本地安装 5分钟 Stable Diffusion 本地安装 1. 引言 1.1 什么是Stable Diffusion? 1.2 本地安装的优势 2. 准备工作 2.1 系统要求 2.2 推荐...
-
whisper安装
安装Whisper 首先需要下载ffmpeg并添加环境变量。打开网站:https://github.com/BtbN/FFmpeg-Builds/releases,选择压缩包并下载到本地。 解压后,找到bin文件夹下的“ffmpeg.exe”,将它复...
-
师兄介绍给我的神器——Copilot:为Rstudio提供GPT编程风格的AI助手
听组会的时候有位师兄分享了一个特别实用的Rstudio 的插件——copilot,GPT 的风终于刮到了 Rstudio,copilot 对于使用 Rstudio 的新手很友好类似于AI 编程助手。 Github Copilot 是...
-
4060显卡+LLaMA-Factory微调LLM环境准备——(一)安装cuda
本地配置 系统:win10**硬件:**i5-12490f+RTX4060 安装原因: 最近尝试在本地对开源LLM进行Fine-tune的时候,用到了LLaMA-Factory,在运行的时候,弹出未检测到GPU,后来才发现,是忘记安装cuda等...
-
探索GitHub Copilot的深度洞见:Copilot Metrics Viewer全面解析
探索GitHub Copilot的深度洞见:Copilot Metrics Viewer全面解析 copilot-metrics-viewerTool to visualize the Copilot metrics provided via the...
-
使用FastChat快速部署LLM服务
原文:https://zhuanlan.zhihu.com/p/705915093 FastChat 是一个用于训练、服务和评估基于LLM的聊天机器人的开放平台,它的核心功能包括: 最先进模型(例如 Vicuna、MT-Bench)的训练和评估代码。...
-
Datawhale X 魔搭 AI夏令营-AIGC文生图方向Task2笔记
学习链接:https://datawhaler.feishu.cn/wiki/UM7awcAuQicI4ukd2qtccT51nug 因为不会专业性的术语所以在此依然是简单记录自己的运行和打卡。 1.文生图理论学习 Deepfake技术 Deepf...
-
8岁女孩玩转AI编程,45分钟打造聊天机器人,Karpathy都看呆了
关于大模型,大厂们最近在卷什么,最新消息是:AI编程工具。 毕竟太火了,火到8岁小女孩都拿着它学AI,45分钟内搭起来一个聊天机器人的“演出”已经被180万人在线围观。 没错,传闻中的“参考模板”,就是这个被Cloudflare副总裁家8岁闺女pick的...
-
24年最新[AI绘画] 简明原生 ComfyUI 零失误安装教程!
前言 本教程适用于为 windows 系统部署原生 ComfyUI 「第0步:搞定网络」 免科学魔法的基本骚操作,见文末。如已科学魔法,略过这一步。如无科学魔法 「第1步:安装所需的必要前置工具」 **所有的AI设计工具,模型和插件,都已经...
-
LLaMA Factory微调Llama3模型
LLaMA Factory是一款开源低代码大模型微调框架,集成了业界最广泛使用的微调技术,支持通过Web UI界面零代码微调大模型,目前已经成为开源社区内最受欢迎的微调框架。 💥GPU推荐使用24GB显存的A10(ecs.gn7i-c8g1.2xlar...
-
ChatGLM-6B入门
ChatGLM-6B ChatGLM-6B 一、介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡...
-
Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——进阶上分 实战优化 Task3笔记
Hi,大家好,我是半亩花海。在上一个任务中,我们逐行精读baseline,掌握了利用AI工具提升学习效率,并制作了话剧连环画,初步了解Secpter WebUI。今天,我们将深入探讨微调的基本原理及其参数,旨在优化效果。同时,介绍文生图工作流平台Comfy...
-
Datawhale AI夏令营第四期 AIGC方向 task02学习笔记
探探前沿:了解一下 AI生图技术 的能力&局限 今天我们的任务是对baseline的代码有一个更加细致的理解,然后我们会学习如何借助AI来提升我们的自学习能力,从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔,你可以...
-
免费开源工具—— Clarity Al:一键图像放大/增强,Magnific平替!
今天给大家推荐一款图像增强工具——Clarity AI ,免费且开源,快来看看吧! 1、效果展示 MagnificAl是一款基于人工智能技术的图像处理工具,主要功能包括图像放大、像素级AI重绘、灵活的设置调整以及多种优化场景。它能够支持最高放大...
-
Datawhale X 魔搭 AI夏令营-AIGC文生图方向 Task02
1.AI生图的能力&局限: 如果我说这是一张AI生成的图片,你能相信吗? 然而幸运又不幸的是它确实是AI生成的。 很难想象在短短几年内,AI生图的能力已经像指数爆炸一样增长。一年前,AI还因为拙劣的画“手”能力被看轻,也因为当时这个情况,...
-
【2024最新版】Stable diffusion汉化版安装教程(附SD安装包),一键激活,永久免费!
目前广泛使用的Stable Diffusion Web UI简称(SDWebUI 是发布在开源平台Github上的一个Python项目,与通常的软件安装方法不同,这个项目并不是下载并安装即可使用的应用程序,而是需要准备执行环境,编译源码. 如果你是一个新...
-
#Datawhale AI夏令营第4期#AIGC方向 文生图 Task2
Task2任务:对baseline的代码有一个更加细致的理解,然后学习如何借助AI来提升我们的自学习能力. 前沿知识:了解一下 AI生图技术 的能力&局限 AI生图技术,通常指的是使用人工智能(尤其是深度学习)来生成图像的技术。这类技术可以用于...
-
推荐使用:Llama Coder - 自主托管的高效代码补全工具
推荐使用:Llama Coder - 自主托管的高效代码补全工具 llama-coderReplace Copilot with a more powerful and local AI项目地址:https://gitcode.com/gh_mirro...
-
4名MIT学霸两年造AI编程帝国,撼动全球2600万开发者!成立2年估值4亿美金
【新智元导读】4名MIT本科生创业,才两年公司就已经估值4亿美元。开发AI编码助手Cursor的Anysphere,最近在A轮融资中已经筹集超6000万美元。而且,这是一家只有12人的公司。AI编程助手,就是行业的下一个风口? MIT学生创业,仅凭12人的...
-
Datawhale夏令营第四期——从零入门AI生图AIGC方向 task1笔记总结
#目录# 一、夏令营内容介绍 适宜学习人群 学习内容提要 二、挑战赛介绍 比赛要求 样例 三、跑通...
-
Datawhale X 魔搭AI夏令营 第四期-AIGC文生图lora方向 Task2笔记
继task01跑通baseline之后,有时候回想起实例中那些自己摸不着头脑的代码片段,确实有些好奇,task2正好用借助通用大语言模型工具精读了一下这些代码片段,并进行了实战演练一一基于话剧的连环画制作。 (这里学习文档给出的大语言模型...
-
AI绘画工具Stable Diffusion+ComfyUI的配置
ComfyUI 是一个基于图形用户界面的开源工具,用于搭建和运行复杂的图像生成和处理工作流。它主要围绕使用 Stable Diffusion 模型来生成高质量的图像。这种工具通常允许用户通过拖放不同的模块或节点,定义数据处理和生成流程,然后通过这些流程生成...
-
CVPR2024|Diffusion模型轻量化与计算效率优化
前言 做算法应该都有顶会梦吧,发不了顶会只能刷一刷顶会了哈哈,向顶会大佬学习 扩散模型的训练和推理都需要巨大的计算成本(显卡不足做DDPM的下游任务实在是太难受了),所以本文整理汇总了部分CVPR2024中关于扩散模型的轻量化与计算效率优化 的相关论文...