-
基于autodl与llama-factory部署llama3-8B开源大模型
一、注册与购买autodl实例 注册了autodl账号以后,我们便可以在网站首页看到具体的实例信息,同时能够观察其具体的系统盘与数据盘以及缓存大小,对于我们即将微调的llama3开源大模型来说,通过资料的查询了解,我们只需要24G显存就可...
-
Llama 3.1深度解析:405B、70B及8B模型的多语言与长上下文处理能力
Llama 3.1 发布了!今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作,确保在 Hugging Face 生态系统中实现最佳集成。Hub 上现有八个开源权重模型 (3 个...
-
精读代码,实战进阶-Datawhale X魔搭AI夏令营 AIGC方向Task02学习笔记
基础知识 AIGC是未来人工智能的重点方向 AIGC高速发展的同时,也被一些心怀不轨之人当作牟利里的技术,如Deepfake技术。 AI生图最早的工具是机械臂输出作画,现代的AI生图模型大多基于深度神经网络基础上训练。 *一般来说,AI生图模型属于多模...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task02 精读代码,实战进阶
今天我们的任务是对baseline的代码有一个更加细致的理解,然后我们会学习如何借助AI来提升我们的自学习能力,从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔,你可以从中学大模型的提问技巧来实现快速学习,学会如何制作一个话剧连环画...
-
跳票至iOS 18.1上线 曝苹果AI将成iPhone 16系列宣传重点
快科技8月25日消息,今日,业内人士Mark Gurman爆料,苹果已经开始对苹果零售店员工进行Apple Intelligence(以下简称AI”)培训,并预计将AI作为iPhone 16在销售时的宣传重点。 Gurman此前透露,苹果的AI功能将跳票至...
-
NVIDIA将发近年最重要科技财报!市场期待能否戳破AI泡沫论
快科技8月25日消息,美东时间8月28日,半导体巨头NVIDIA将公布其2025财年第二财季业绩,市场普遍预期这将是近年来科技界最重要的一份财报。 虽然多位分析师都给出了乐观预期,但不可否认的是,投资AI是场回报率难达预期的泡沫”疑虑仍难消解。 如果NVI...
-
微软工程师工资曝光!AI部门平均270万远超其他部门
快科技8月25日消息,据媒体报道,数百名微软员工自愿分享了他们的薪资和晋升信息,其中包括超过500名美国员工的详细数据。 分析这些数据后发现,微软软件工程师的平均薪酬范围很广,从148436美元到1230000美元不等,对应着从Level 59到Level...
-
基于LORA的Stable Diffusion模型在虚拟试衣中的应用
基于LORA的Stable Diffusion模型在虚拟试衣中的应用 引言 1.1 简述虚拟试衣的市场背景和技术需求 1.2 介绍LORA与Stable Diffusion模型的结合在虚拟试衣领域的潜力 1.3 强调基于LORA的Stable...
-
Datawhale AI夏令营第四期AIGC方向Task2学习笔记
Kolors(可图)模型 Kolors是由快手团队开发的大规模文本到图像生成模型(可图 · 模型库 (modelscope.cn )根据链接的文章内容,Kolors在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面,显著优于开源和专有...
-
关于Stable diffusion的各种模型,看这篇就可以了!
前言 这篇文章主要是帮大家梳理下Stable diffusion里面的各种模型,模型在Stable diffusion中占据着至关重要的地位,不仅决定了出图的风格,也决定了出图质量的好坏。 但在第一次接触SD的时候,我就被里面的模型搞到头大,不仅有多...
-
【AIGC】FaceChain:发挥生成式内容的无限可能性
基于图像生成的个性化肖像框架 摘要 FaceChaine提供了一系列的生成方案,通过少量的图像输入,就能生成逼真的个性化肖像。它是一个个性化肖像生成框架,包含丰富的人脸感知相关的模型,例如人脸检测,深度人脸向量提取,人脸属性分析等等。输入主要的肖像...
-
标题:微调Whisper模型,打造超高效语音识别利器!
标题:微调Whisper模型,打造超高效语音识别利器! Whisper-FinetuneFine-tune the Whisper speech recognition model to support training without timesta...
-
DALL·E 2 模型实现与运行指南
DALL·E 2 模型实现与运行指南 DALLE2-pytorchImplementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytor...
-
AIGC从入门到实战:涌现:人工智能的应用
AIGC从入门到实战:涌现:人工智能的应用 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词:AI生成内容、涌现现象、应用案例、技术挑战、未来展望 1. 背景介绍 1.1 问题...
-
Datawhale X 魔搭 AI夏令营(AIGC Task3)学习笔记
目录 认识ComfyUI 1. 什么是 ComfyUI 2. ComfyUI 核心部件 3. ComfyUI 图片生成流程 4. ComfyUI 的优势 使用ComfyUI 下载ComfyUI: 运行ComfyUI: 自我学习: LOR...
-
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【新智元导读】就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了! Transformer...
-
2024年国内版AI写作对话工具推荐
以下排名随意编排,无先后。 提高工作效率的AI神器🔥 | 国内版 笔尖AI写作 能写文案、读文献、互动答疑,多场景写作模板,不限于某个领域,12+种职位的 100+ 工作场景,10秒即可生成一篇专业文章。 推荐指数⭐⭐⭐⭐ 豆包 聊天机器人、写...
-
You.com 希望区别于谷歌成为解决复杂工作查询的 AI 搜索引擎
计算机科学家 Richard Socher 早在斯坦福大学攻读博士学位时就构思了 You.com,但在 2009 年至 2014 年间,由于谷歌的统治地位,Socher 选择暂时搁置这一概念。 随着提示工程的发展——即为生成式 AI 工具创建输入以生成所...
-
超精细CG杰作:8K壁纸级官方艺术插画,展现极致美丽与细节的汉服女孩
极致精美的数字艺术杰作:8K壁纸级别的官方插画,展现超高清细节与和谐统一的美感,女孩的精致面容与眼神在光影下熠熠生辉,汉服主题下的超高分辨率作品,文件巨大,细节丰富,令人惊叹。 正向提示词 bestquality,masterpiece,illust...
-
Transformer作者预警:只卖模型玩不过OpenAI!
Transformer八子中最年轻的Aidan Gomez在最新的采访中感叹: 谷歌版的Aidan Gomez,是给AI领域带来深远影响的Transformer作者之一。 而现在的Aidan Gomez,是估值飙升55亿美元的Cohere公司的联合创始人...
-
Llama 3.1中文微调数据集已上线,超大模型一键部署
7 月的 AI 圈真是卷完小模型卷大模型,精彩不停!大多数同学都能体验 GPT-4o、Mistral-Nemo 这样的小模型,但 Llama-3.1-405B 和 Mistral-Large-2 这样的超大模型让很多小伙伴犯了难。 别担心!hyper.a...
-
Cursor AI 与 GitHub C0pilot:哪个更适合程序员?
近年来,由 AI 驱动的编码助手在帮助开发者编写、审查或理解代码方面取得了巨大进展。在这个领域中,Cursor AI 和 GitHub C0pilt 是两个非常受欢迎的工具。选择哪一个更适合自己,取决于个人需求和偏好,因为这两款工具各有优缺点。本文将比较它...
-
AIGC:clip-interrogator
文字生成图片是近年来多模态和大模型研究的热门方向,openai提出的CLIP提供了一个方法建立起了图片和文字的联系,但是只能做到给定一张图片选择给定文本语义最相近的那一个,实际项目开发中我们总是需要从一张图片获取描述,clip-interrogator应运...
-
一划就能拯救废片!华为Mate60等三款机型升级支持AI消除功能了
快科技8月24日消息,华为终端BG首席执行官何刚今天发文称,现在华为Mate60系列、华为Mate X5、华为Pocket 2都可以升级支持AI消除功能了! 大家假期出游拍照的时候都遇到过路人误入画面,或者有杂物影响美观,华为的AI消除功能可以很好地帮大家...
-
【AIGC】ComfyUI 入门教程(4):ComfyUI 管理器|AI 生成图片
前言 ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面(GUI)。通过将不同的节点连接在一起,你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作流看起来像下面这样: 所有的AI设计工具,...
-
“Datawhale X 魔搭” AI夏令营第四期:AIGC方向——Task2&Task3
背景介绍 AIGC技术 AIGC(AI-Generated Content 是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。例如,通过输入关键词、描述或样本...
-
五个优秀的免费 Ollama WebUI 客户端推荐
认识 Ollama 本地模型框架,并简单了解它的优势和不足,以及推荐了 5 款开源免费的 Ollama WebUI 客户端,以提高使用体验。 什么是 Ollama? Ollama 是一款强大的本地运行大型语言模型(LLM)的框架,它允许用户在自己...
-
无需抠图!AI绘画直接文本生成透明底图层,设计师必看的ComfyUI透明图层生成工作流教程!(附插件模型)
大家好,我是画画的小强 AI 绘画自出现以来一直都在不断发展完善,实现了很多我们在实际应用中迫切需要的功能,比如生成正确的手指、指定的姿势、准确的文本内容等。上周,又一个重磅新功能在开源的 SD 生态内实现了——直接通过文本直接生成透明底图像和图层!这将...
-
ComfyUI插件:ComfyUI layer style 节点(三)
前言: 学习ComfyUI是一场持久战,而ComfyUI layer style 是一组专为图片设计制作且集成了Photoshop功能的强大节点。该节点几乎将PhotoShop的全部功能迁移到ComfyUI,诸如提供仿照Adobe Photoshop的图...
-
『SD』ControlNet基础讲解
AI工具SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,无需自行查找,有需要的小伙伴下方扫码自行获取。 本文简介 在学习和使用『Stable Diffusion』的过程中,『ControlNet』是一个不可忽视的关键组...
-
snipaste最强平替!轻松搞定截图贴图还有OCR文字识别!工作效率提高300%
Snipaste 一直被吐槽没有 OCR 功能,而且功能也一直没有优化,不少小伙伴都在问有没有类似的平替?当然有啦!小编为您挖到一款超强的国产软件——千鹿设计助手,它堪称是 Snipaste 的完美平替! 目前千鹿设计助手还在不断优化功能,小编这边也要到...
-
【粉丝福利社】Adobe Firefly:萤火虫:AI绘画快速创意设计(文末送书-进行中)
🏆 作者简介,愚公搬代码 🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,51CTO博客专家等。 🏆《近期荣...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 Task02笔记
一.认识通义千问 通义千问是一款具有信息查询、语言理解、文本创作等多能力的AI助手。其中,编程与技术支持能力是它的强项之一。 我们可以利用通义千问帮助辅助分析代码结构和功能 二.精读baseline 文生图代码的框架结构: 可以看到,这段代码...
-
详解 玻色哈伯德模型(Bose-Hubbard Model)
玻色哈伯德模型(Bose-Hubbard Model)详解 玻色哈伯德模型是量子多体物理中的一个重要模型,主要用于描述玻色子在晶格中的行为,特别是在冷原子物理和凝聚态物理中。该模型是哈伯德模型的一种扩展,专门针对玻色子,而非费米子。 1. 模型背景...
-
部署本地语音聊天机器人:在Seeed Studio reComputer Jetson上部署Riva和Llama2
本地语音聊天机器人:在Seeed Studio reComputer Jetson上部署Riva和Llama2 所有教程都免费开源,请动动小手点个小星星https://github.com/Seeed-Projects/jetson-examples...
-
超越SD3,比肩MJ v6,文生图模型FLUX.1开源
近日,图片生成模型FLUX.1引爆了AIGC社区,其在视觉质量、图像细节和输出多样性等方面性能优越,输出极佳的图片生成效果。 FLUX.1系列模型由Black Forest Labs开源,创始人Robin Rombach是Stable Diffu...
-
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
【导读】 适逢Llama 3.1模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型或RAG系统的微调生成合成数据。 Epoch AI上个月刚刚发文[预言数据墙」迫近,结果英伟达转头就甩出了340B开源巨兽Ne...
-
AIStarter更新ollama+openwebui教程,使用千问2和llama3.1最新大模型
熊友们,从易到难啊,整合包做起来相对复杂一些,咱可以先学习一下怎么在AIStarter里面升级AI项目,因为Docker用不了,什么原因咱不知道,所以很多熊友迫切的希望熊哥更新ollama+openwebui这个项目,那就以这个项目为例,给大家演示一下熊哥...
-
【LLM】一、利用ollama本地部署大模型
目录 前言 一、Ollama 简介 1、什么是Ollama 2、特点: 二、Windows部署 1.下载 2.安装 3.测试安装 4.模型部署: 5.注意 三、 Docker部署 1.do...
-
使用Copilot辅助编程:我如何减少加班并提高工作效率
当我聘用了一个高级工程师给我写代码,我再也不加班了! 很多医生朋友说写代码很难,学不会python。在这个AI时代,作为智慧的顶尖人类,你还在百度搜代码真的是out了。 学会站在巨人的肩膀上,让AI替你搬砖! Tina姐之前在朋友圈发了个视频,内容就...
-
智能语音生成会议纪要的神器
嘿,技术爱好者们,今天我想分享一个令人兴奋的智能语音项目。它巧妙地结合了faster-whisper、Pyannote以及一系列先进的大语言模型,旨在为会议纪要的自动化生成带来新的可能。 开发了一个智能语音生成会议纪要的神器 在线体验:智能语音...
-
摩尔线程开源音频理解大模型MooER:38小时训练5000小时数据
快科技8月23日消息,摩尔线程官方宣布,音频理解大模型MooER”(摩耳)已经正式开源,并公布在GitHub上:https://github.com/MooreThreads/MooER 目前开源的内容包括推理代码,以及5000小时数据训练的模型,后续还将...
-
华为Mate 60/X5、Pocket 2新增重磅功能:支持AI消除了 拍照神器
快科技8月24日消息,华为李小龙今天晒图展示了AI消除功能,并表示华为Mate 60系列、华为Mate X5、华为Pocket 2三款老机型都已经新增支持。 据悉,该功能此前仅限于Pura 70系列、nova 12 Ultra星耀版、nova Flip三款...
-
Datawhale X 魔搭 AI夏令营 AIGC Task2笔记
对于task2里的这几句话本人还是十分赞成的 定期关注AI生图的最新能力情况都十分重要: 对于普通人来说,可以避免被常见的AI生图场景欺骗,偶尔也可以通过相关工具绘图 对于创作者来说,通过AI生图的工具可以提效,快速制作自己所需要的内容 对...
-
Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC
Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。...
-
[AIGC] Doris:一款高效的MPP数据仓库引擎
在大数据处理的领域中,Apache Doris(原百度 Palo)是一个高效的MPP(大规模并行处理)数据仓库,最初由百度开发,现在已经成为Apache的孵化项目。 (图片取自百度 – 文章目录 1. Doris的基础知识 2....
-
【课程总结】day24(上):大模型三阶段训练方法(LLaMa Factory)
前言 本章我们将通过 LLaMA-Factory 具体实践大模型训练的三个阶段,包括:预训练、监督微调和偏好纠正。 大模型训练回顾 训练目标 训练一个医疗大模型 训练过程实施 准备训练框架 LLaMA Factory是一款开源低...
-
论文AIGC检测结果不合格的标准是?
有关于AIGC检测系统结果的讨论越来越多,尤其是对不合格检测结果多少,更是引起了许多热议。那么通过AIGC检测系统检测出的AI率到底多少为不合格呢?其实论文的AIGC检测合格并没有明确的标准,它取决于各学校、期刊、机构等。它们通常对于AI率的标准可能会有所...
-
Stable Diffusion【Pony模型】【2.5D模型】:细腻画质&可爱韩版风格的大模型Speciosa 2.5D
大家好我是安琪!!! Stable Diffusion是一款前沿的AI图像生成技术,它能够根据提示词创造出极具艺术感的图像。本文将探讨如何利用Stable Diffusion的图生图功能和局部重绘(手涂蒙版)技术,为您的艺术创作带来全新的创意和个性化表达...
-
最强终端部署的多模态MiniCPM-V模型部署分享(不看后悔)
MiniCPM-V模型是一个强大的端侧多模态大语言模型,专为高效的终端部署而设计。 目前该模型有MiniCPM-V 1.0、MiniCPM-V 2.0和MiniCPM-Llama3-V 2.5版本。 MiniCPM-V 1.0模型:该模型系列第一个版本...