基础模型第3页 - AIGC资讯

SenseVoice 实测，阿里开源语音大模型，识别效果和效率优于 Whisper，居然还能检测掌声、笑声！5分钟带你部署体验

前段时间，带着大家捏了一个对话机器人：手把手带你搭建一个语音对话机器人，5分钟定制个人AI小助手（新手入门篇）其中语音识别（ASR）方案，采用的是阿里开源的 FunASR，这刚不久，阿里又开源了一个更强的音频基础模型，该模型具有如下能力：语音识别...

人工智能 2024-08-01 人工智能

3373阅读

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

经历了提前两天的「意外泄露」之后，Llama 3.1 终于在昨夜由官方正式发布了。 Llama 3.1 将上下文长度扩展到了 128K，拥有 8B、70B 和 405B 三个版本，再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说，...

大数据 2024-08-01 人工智能

790阅读

Stable Diffusion【真人模型】：SD1.5人像模型新高度，超级逼真的AI真人模型：AWPortaint

今天和大家分享一个基于SD1.5基础模型训练的人像大模型AWPortrait。该模型在真人写实摄影方面效果超级逼真，能够模拟在真实摄影中的光影效果、皮肤纹理质感、甚至是人物的表情和妆容。目前最新的版本是V1.4，在V1.3版本的基础上升级而来，对大模型...

人工智能 2024-07-30 人工智能

1363阅读

苹果AI震撼上线iPhone，进化版Siri却没有ChatGPT！47页技术报告揭秘自研模型

【新智元导读】今早，所有开发者们被突如其来iOS18.1测试版砸晕了!没想到，苹果AI这就可以上手尝鲜了，一大波测评刷屏全网。更惊喜的是，苹果AI背后的基础模型47页技术报告，也一并上线了。一大早，人们期待已久的「苹果AI」首个预览版，正式向开发者们推送...

人工智能 2024-07-30 人工智能

976阅读

用LoRA微调 Llama 2：定制大型语言模型进行问答

Fine-tune Llama 2 with LoRA: Customizing a large language model for question-answering — ROCm Blogs (amd.com 在这篇博客中，我们将展示如何在AM...

AIGC 2024-07-29 人工智能

1019阅读

项目实训：python whisper安装运行实现语音识别技术

1.最好用python3.9以上的版本 2.安装whisper库 pip install -U openai-whisper 输入whisper查看是否安装成功 3.下载ffmpeg并添加环境变量 Releases · BtbN/FFmpeg...

大数据 2024-07-28 人工智能

1304阅读

自回归模型胜过扩散模型：用于可扩展图像生成的 Llama

? 文献卡 Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation 作者: Peize Sun; Yi Jiang; Shoufa Chen; Shil...

人工智能 2024-07-27 人工智能

1222阅读

对标Sora！快手自研视频生成大模型可灵AI全面开放内测

快科技7月25日消息，日前，快手视频生成大模型可灵AI宣布基础模型升级，并全面开放内测，同时正式上线付费会员体系。用户每日登录都可免费获得66灵感值，可用于兑换可灵AI平台内指定的功能使用权或增值服务，可生成约6个免费视频。据了解，可灵AI基础模型升...

大数据 2024-07-25 人工智能

2145阅读

AIGC领域综述

AIGC领域综述 2023 1. A Survey of Large Language Models 2. A Complete Survey on Generative AI (AIGC : Is ChatGPT from GPT-4 to...

生成式AI 2024-07-22 人工智能

1119阅读

欢迎 Llama 3：Meta 的新一代开源大语言模型_meta llama guard 2

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地全力支持此次发布，并实现了与 Hugging Fac...

大数据 2024-07-20 人工智能

1341阅读

全面了解三大 AI 绘画：Midjourney、Stable Diffusion、DALL·E 的区别和特点

大家好，我是设计师阿威在当前，比较流行的 AI 绘画软件主要有三个，分别是：StabilityAI 公司的 Stable Diffusion，OpenAI 公司的 DALL·E2，以及更为大众所熟知的，Leap Motion公司创始人 David Ho...

AIGC 2024-07-16 人工智能

2368阅读

微软发现“万能钥匙”，成功入侵GPT-4o、Claude 3

微软Azure首席技术官Mark Russinovich在官网分享了新型大模型入侵技术——“Skeleton Key”（万能钥匙）。据悉，万能钥匙是一种越狱攻击方法，其核心原理是使用多轮强制、诱导策略使大模型的安全护栏完全失效，让其回答一些禁止的答案，包...

大数据 2024-07-16 人工智能

1018阅读

【AIGC调研系列】InternVL开源多模态模型与GPT-4V的性能对比

InternVL和GPT-4V都是多模态模型，但它们在性能、参数量以及应用领域上有所不同。 InternVL是一个开源的多模态模型，其参数量为60亿，覆盖了图像/视频分类、检索等关键任务，并在32个视觉-语言基准测试中展现了卓越性能[2]。InternV...

大数据 2024-07-15 人工智能

1672阅读

18个月326项能力，这家大厂猛上新生成式AI，如今纯靠Prompt就搞定企业级应用了

构建生成式 AI 应用，现在只需要几分钟。「生成式 AI 的半衰期只有六个月，」亚马逊云科技全球 AI 产品副总裁 Matt Wood 说道。 2024开启下半年，人们发现，生成式技术和落地之间的距离，已经不能用「远」或「近」完全概括。狂热的百模大战之...

AIGC 2024-07-12 人工智能

893阅读

在stable diffusion中如何分辨lora、大模型、controlnet

LoRA (LowRank Adaptation Stable Diffusion LoRA 是微软的研究人员为了解决大语言模型微调而开发的一项技术,它是一个多模态语言-图像模型，LORA 可以学习将其语言表征迁移到图像 modal 中从而获得跨模态...

人工智能 2024-07-11 人工智能

978阅读

AI自学超越人工标注训练，蚂蚁数科2篇自监督学习论文入选国际顶会

近日，蚂蚁数科2项研究成果分别入选“欧洲计算机视觉会议（ECCV）”和“国际机器学习大会(ICML ”，可实现无需人工打标数据的情况下，通过自监督学习、强化学习等方法训练模型输出可信结果。据悉，两项成果将被应用于视频版权保护和智能问答领域。作为人工智能领域...

AIGC 2024-07-11 人工智能

971阅读

Stable Diffusion保姆级教程，看完连老奶奶都能上手！

本期目录：Stable Diffusion 1-配置要求 2-安装教程 3-关于版本及更新 4-启动打开 5-界面说明及绘制 1-配置要求 1、硬件要求：最好使用N卡（NVIDIA显卡），显卡的显存至少需要4GB以上显存才能在本地运行。最...

大数据 2024-07-11 人工智能

1876阅读

70万人争先体验！视频生成新王者「可灵AI」又双叒升级了

难不成，AI 生成短剧时代真的要来了? 最近，各路视频生成 AI 放出的 Demo 让人眼花缭乱。从玩梗图、拼长度再到讲究真实物理逻辑，层出不穷的人工智能创意难分高下，个个都要跟 Sora 试比高。这时候，突然有人偷偷先行一步，搞出了「电影级」的表现: 从...

生成式AI 2024-07-10 人工智能

943阅读

AI绘画Stable diffusion的SDXL模型超详细讲解，针不错！（含实操教程）

大家好，我是画画的小强朋友们好，今天分享的是Stable diffusion的SDXL模型以及相关实操。与之前的SD1.5大模型不同，这次的SDXL在架构上采用了“两步走”的生图方式：以往SD1.5大模型，生成步骤为 Prompt → Ba...

生成式AI 2024-07-09 人工智能

1791阅读

AI写真教程：Stable Diffusion 之 IPAdapter-FaceId

自Stable Diffusion发布以来，AI写真一直是AIGC界的热门话题。 AI写真为摄影师和艺术家提供了全新的创作工具。通过AI技术，艺术家可以轻松实现复杂的图像效果，如风格迁移、图像合成等，AI写真能够在短时间内完成传统摄影师和设计师需要耗费大...

AIGC 2024-07-09 人工智能

1165阅读

国产大模型 WAIC 竞技：大厂拼落地，中厂显焦虑

如果想要度量国产大模型大小厂商的实力，WAIC（世界人工智能大会）是一个不错的切口。众所周知，2023年是国产大模型元年，在去年的 WAIC 之后，腾讯发布混元大模型，字节跳动上线豆包 APP，而后通过豆包大模型正式开启对外服务，年轻的月之暗面、Mini...

人工智能 2024-07-08 人工智能

919阅读

AI+视频 | Nvidia 投资的AI公司，通过视频理解开创感知推理，获顶级风投5000万美元融资

在每天刷视频的时代，我们如何快速创作360度全方位理解的视频内容? Twelve Labs，一家旧金山初创公司，是由一支年轻的工程师团队Jae Lee 和 Aiden L 创立，该产品可在视频中提取特定视频瞬间，包括视觉、音频、文本和上下文信息，以实现语义...

生成式AI 2024-07-08 人工智能

1247阅读

Stable Diffusion 模型分享：ReV Animated

本文收录于《AI绘画从入门到精通》专栏，专栏总目录：点这里。文章目录模型介绍生成案例案例一案例二案例三案例四案例五案例六案例七案例八...

大数据 2024-07-07 人工智能

1106阅读

一键进阶ComfyUI！懂AI的设计师现在都在用的节点式Stable Diffusion

前言 _ 万字教程！奶奶看了都会的 ComfyUI 入门教程推荐阅读一、川言川语大家好，我是言川。阅读文章 > ](https://www.uisdc.com/comfyui-3 目前使用 Stable Diffusion...

生成式AI 2024-07-07 人工智能

3244阅读

AIGC最新资讯收集

阿里免费的 AI 创意海报生成工具—— ModelScope 魔搭社区 PosterGenius 魔搭（ModelScope）是阿里达摩院重磅推出的一个 AI 模型社区。里面有众多开源模型，还有很多开箱即用的在线 Demo。比如前段春节期间的用的比较...

生成式AI 2024-07-06 人工智能

1120阅读

Stable Diffusion本地化部署详细攻略

一、硬件要求内存：至少16GB 硬盘：至少60GB以上的磁盘空间，推荐SSD固态硬盘显卡：推荐NVIDIA显卡显存：至少4GB Stabl Diffusion因为是在本地部署，对显卡的要求比较高，如果经济能力可以的话，建议购买一块性能较好...

生成式AI 2024-07-06 人工智能

1995阅读

使用LLaMA-Factory微调Llama3大模型

一、基础模型下载本文的背景是微调一个基于Llama3的中文版模型Llama3-8B-Chinese-Chat，用于中文指定领域的问答下游任务 1、HuggingFace官网直接下载官网地址：https://huggingface.co/mo...

人工智能 2024-07-05 人工智能

1401阅读

【LLM教程-llama】如何Fine Tuning大语言模型？

今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning ！（代码和详细解释放在后文）目录大语言模型进行微调(Fine Tuning 需要哪些步骤？大语言模型进行微调(Fine Tuning 训练过程及代码...

AIGC 2024-07-04 人工智能

1092阅读

AIGC 011-SAM第一个图像分割大模型-分割一切！

AIGC 011-SAM第一个图像分割大模型-分割一切！文章目录 0 论文工作 1论文方法 2 效果 0 论文工作这篇论文介绍了 Segment Anything (SA 项目，这是一个全新的图像分割任务、模...

人工智能 2024-07-03 人工智能

867阅读

4步生成高质量图像，Stable Diffusion WebUI 1.9.0来了！

上周Stable Diffusion WebUI正式发布了1.9.0版本，我也第一时间把AutoDL镜像升级到了最新版本，有几个比较重要的更新再和大家同步下。 1、为SDXL-Lightning模型使用SGM统一调度器 SDXL-Lightning由字...

AIGC 2024-07-03 人工智能

762阅读

探索多模态智能边界：Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南

探索多模态智能边界：Visual-Chinese-LLaMA-Alpaca 开源项目解析与应用指南在人工智能领域，多模态学习正逐渐成为研究热点，它旨在融合视觉和语言信息，构建能够理解和生成跨模态内容的智能体。Visual-Chinese-LLaMA...

生成式AI 2024-07-02 人工智能

979阅读

AI绘画-Stable Diffusion三次元人物模型训练（炼丹）教程，你也可以定制你的三上youya老师！

大家好，我是设计师阿威（Stable diffusion生成的三上youya老师）用AI进行画出不同人物，我们需要训练自己Lora模型。除了训练二次元人物之外，也常常要训练三次元人物。比如福利姬老师可以训练自己然后穿上各种美美的衣服来拍照，...

人工智能 2024-07-02 人工智能

1512阅读

从零开始，手把手教你本地部署Stable Diffusion Webui AI绘画

大家好我是AI极客菌 Stable Diffusion是一款基于深度学习的图像生成模型，它能够在没有任何人类指导的情况下生成高质量、逼真的图像。想要在自己的电脑上体验Stable Diffusion的强大功能吗？本文将带你一步步了解如何在本地部署Stab...

AIGC 2024-07-01 人工智能

2014阅读

Stable Diffusion——四种模型 LoRA（包括LyCORIS）、Embeddings、Dreambooth、Hypernetwork

目前 Stable diffusion 中用到主要有四种模型，分别是 Textual Inversion （TI）以 Embeddings 为训练结果的模型、Hypernetwork 超网络模型、LoRA（包括 LoRA 的变体 LyCORIS）模型、Dr...

人工智能 2024-07-01 人工智能

1870阅读

2024年最新Stable Diffusion本地化部署详细攻略，手把手教程（建议收藏!!)_stable diffusion 本地部署

今天有网友问到SD本地部署的攻略，我找到以前收集的资料发出来分享给大家，希望对大家有帮助！ Stable Diffusion本地化部署详细攻略一、硬件要求内存：至少16GB 硬盘：至少60GB以上的磁盘空间，推荐SSD固态硬盘显卡：推荐NV...

AIGC 2024-06-30 人工智能

2108阅读

深度测评：SD3模型表现如何？实用教程助你玩转Stable Diffusion 3 ，最强SD3模型使用攻略，附ComfyUI实操SD3模型到底如何？StableDiffusion3全面评测！

深度测评：SD3模型表现如何？实用教程助你玩转Stable Diffusion 3 ，最强SD3模型使用攻略，附ComfyUI实操 SD3模型到底如何？StableDiffusion3全面评测！如何使用ComfyUI遍历题词｜模型？大家好...

AIGC 2024-06-30 人工智能

2080阅读

Stable Diffusion为什么生成的图片总是糊的？

我们先看一下出图时模糊的图片效果。我相信很多初学者在开始绘图的时候经常会碰到这种情况。当然我自己也曾经碰到过，我总结了一下，一般有以下几种情况。第一种情况：大模型使用的是SDXL大模型，VAE模型选择了vae-ft-mse-8400...

生成式AI 2024-06-30 人工智能

1536阅读

通过ORPO技术微调 llama3大模型(Fine-tune Llama 3 with ORPO)

通过ORPO对llama进行微调前言 ORPO是一种新颖的微调技术，它将传统的监督微调和偏好对齐阶段整合到一个过程中。这减少了训练所需的计算资源和时间。此外，经验结果表明，ORPO在各种模型大小和基准测试中都超过了其他对齐方法。在本文中，我们将...

生成式AI 2024-06-30 人工智能

930阅读

释放Stable Diffusion 无限可能

最近在整理大语言模型的系列内容，Stable Diffusion 是我下一篇博客的主题。关注 Stable Diffusion，是因为它是目前最受欢迎和影响力最大的多模态生成模型之一。Stable Diffusion 于 2022 年 8 月发布，主要用于...

生成式AI 2024-06-29 人工智能

936阅读

Meta Llama 3 模型与亚马逊 Bedrock 完美融合，释放无限潜能。如何通过SageMaker来部署和运行推理

文章目录 Meta Llama 3模型现在在亚马逊Bedrock上可用 Llama 3 模型 Llama 3 模型的实际应用什么是 Meta Llama 3 什么是 SageMaker JumpStart 探索型号部署模型运行推理 7...

生成式AI 2024-06-28 人工智能

951阅读

百度文心一言插件商城正式上线！一键安装搞定PPT生成、音视频提取

快科技12月14日消息，日前，百度官方宣布，百度文心一言插件商城正式上线，插件覆盖办公提效、多模态内容理解生成、专业信息查询等实用场景。用户一键安装插件后，只需通过简单指令，即可实现PPT生成、音视频提取、思维导图制作等多场景多模态下的需求。...

人工智能 2024-06-26 人工智能

882阅读

增强大型语言模型（LLM）可访问性：深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程

Enhancing LLM Accessibility: A Deep Dive into QLoRA Through Fine-tuning Llama 2 on a single AMD GPU — ROCm Blogs 基于之前的博客《使用Lo...

人工智能 2024-06-26 人工智能

1430阅读

本地运行 Llama 3，可以中文，但不强

Llama 3 简介大家好，上个月 Meta 发布 Llama 3，大模型开源世界又热闹起来了。 Llama 3 提供两个版本（8B 和 70B）： **8B 版本适合在消费级 GPU 上高效部署和开发； 70B 版本则专为大规模 AI...

人工智能 2024-06-26 人工智能

974阅读

CIO应重点关注的领域，以维持GenAI的势头

GenAI仍然是大多数企业的首要投资重点，而且期望值很高。根据普华永道的最新调查，美国61%的CEO预期AI将改变他们的业务价值生成方式，但要实现这一目标，企业必须将AI的炒作转化为现实。好消息是，他们在这方面越来越擅长。事实上，根据Databric...

大数据 2024-06-25 人工智能

863阅读

描述如何启用 Microsoft Copilot for Security

要开始使用 Microsoft Copilot for Security，组织需要采取措施来加入服务和用户。这些包括：提供副驾驶容量设置默认环境分配角色权限供给能力 Microsoft Copilot for Securi...

生成式AI 2024-06-24 人工智能

962阅读

何恺明新作再战AI生成：入职MIT后首次带队，奥赛双料金牌得主邓明扬参与

何恺明入职MIT副教授后，首次带队的新作来了! 让自回归模型抛弃矢量量化，使用连续值生成图像。并借鉴扩散模型的思想，提出Diffusion Loss。他加入MIT后，此前也参与过另外几篇CV方向的论文，不过都是和MIT教授Wojciech Matusi...

大数据 2024-06-24 人工智能

882阅读

AI绘画Stable Diffusion新手超详细快速入门教程，我不允许你还不会！

大家好，我是程序员晓晓关于Ai绘画，很多人在体验了Midjourney（以下简称MJ）之后，发现它创意能力很强，但可控性比较弱，不便应用，于是转向Stable Diffussion（以下简称SD），但又发现SD貌似很复杂。我在后台收得比较多的留言，都是...

AIGC 2024-06-24 人工智能

1286阅读

【AI知识】Stable diffusion常用提示词分享

模型（Model） majicmixRealistic_v7 majicmixRealistic（麦橘写实）是融合了多种展现日常生活人物形象的写实风格模型，人物的外观更加接近现实生活，对于光影、皮肤、人物动态均有较好的表现，非常适合出美女图片。 L...

人工智能 2024-06-24 人工智能

2086阅读

每日AIGC最新进展(25)：复旦大学提出参数高效微调框架Adapter-X、上海交通大学提出大型多模态模型新测试标准A-Bench、腾讯提出统一多模态布局生成框架PosterLLaVa

Diffusion Models专栏文章汇总：入门与实战 Adapter-X: A Novel General Parameter-Efficient Fine-Tuning Framework for Vision 本文提出了一种新的参数高效...

人工智能 2024-06-22 人工智能

934阅读

LLaMA 羊驼系大语言模型的前世今生

关于 LLaMA LLaMA是由Meta AI发布的大语言系列模型，完整的名字是Large Language Model Meta AI，直译：大语言模型元AI。Llama这个单词本身是指美洲大羊驼，所以社区也将这个系列的模型昵称为羊驼系模型。 Ll...

人工智能 2024-06-21 人工智能

1669阅读