-
卢伟冰:目前AI手机只是有AI功能 小米澎湃OS2.0才是真正的AI手机
快科技8月23日消息,AI手机成为当下热门题材,各大厂商都号称最新推出的智能手机带AI功能。 对于AI手机”,卢伟冰分享了自己的观点:到目前发布的号称AI手机的都是AI Feature手机,也就是用AI的技术做了一些AI功能。 在卢伟冰看来,真正的AI手机...
-
WhisperS2T:加速语音转文本的高效解决方案
WhisperS2T:加速语音转文本的高效解决方案 WhisperS2TAn Optimized Speech-to-Text Pipeline for the Whisper Model Supporting Multiple Inference E...
-
AI应用商店是门好生意,可要如何说服开发者入驻?
无论Epic Games、Spotify这种一直与苹果对簿公堂,还是腾讯、抖音这样试图钻相关规则漏洞的公司,对于苹果通过应用内购买(IAP)抽取30%的费用,越来越多的头部开发者开始失去耐心。但就在抱怨“苹果税”的同时,有能力的厂商也在尝试复刻苹果建立的这...
-
程序员掌握Stable Diffusion,下班后打造月入3000+的AI绘画副业
一、引言 在技术日新月异的今天,程序员这个职业不仅要求我们不断学习新技术,还需要我们具备一定的创新思维。作为一名程序员,我在接触到Stable Diffusion(以下简称SD)后,发现了新的副业机会。以下是我如何利用SD在下班后赚取额外收入,最终实...
-
马斯克的 Grok AI 聊天机器人因惊人的深度伪造特朗普和泰勒·斯威夫特而迅速走红
埃隆·马斯克的 Grok AI 聊天机器人正在互联网上泛滥,生成了从唐纳德·特朗普到马斯克本人的「深度伪造」图像——生成的图片有的完全荒诞到极其令人不安等。 自上周发布以来,Grok 的用户不断生成假冒的特朗普图像,如抢劫便利店或驾驶飞机飞向双子塔的画面...
-
Stable Diffusion整合包与手动本地部署结合内网穿透远程AI绘画
文章目录 前言 1. 本地部署Stable Diffusion Web UI 1.1 整合包安装 1.2 手动安装Stable Diffusion Web UI 2. 安装Cpolar内网穿透 3. 实现公网访问Stable Diffusi...
-
陈天桥联手Science推AI驱动科学大奖!千字论文抱走3万美金,挖掘诺奖潜力股
近日,天桥脑科学研究院(Tianqiao & Chrissy ChenInstitute,简称研究院)与《科学》杂志联合宣布,推出一项AI驱动科学大奖,表彰全球范围内用人工智能技术推动各个领域科学研究并取得突破性进展的青年科学家。 前中国互联网大佬...
-
Hexo搭建个人博客系列【八】- Butterfly侧边栏公众号
本期将为大家讲解如何在Hexo Butterfly主题的侧边栏显示公众号图片。 0. 前期回顾 最新Hexo+GitHubPages搭建个人博客【一】 最新Hexo+GitHubPages搭建个人博客【二】-使用Vercel加速和自定义域名...
-
SD绘画 | 人脸修复插件ADetailer:拒绝脸崩,轻松解决多人故事场景脸部崩坏,Stable Diffusion 修脸大法教程
大家好,我是程序员晓晓 在使用AI绘画工具 Stable Diffusion 进行人像出图时,你是不是经常会遇到多人或单人的脸部崩坏情况。那今天就给大家分享一下,如何通过 ADetailer 这款SD插件,对人物的脸部进行修复。 首先我们构造一个多人的...
-
快速体验LoRA微调Llama3-8B模型以及海光DCU推理加速(曙光超算互联网平台国产异构加速卡)
序言 本文以 LLaMA-Factory 为例,在超算互联网平台SCNet上使用异构加速卡AI 显存64GB PCIE,对 Llama3-8B-Instruct 模型进行 LoRA 微调、合并和推理。 一、参考资料 github仓库代码:LLaM...
-
Stable Diffusion学习指南【ControlNet下篇】- 超全面控图类型&模型拆解
(注:文末扫码获取AI工具安装包和AI学习资料) 以下是正文部分 在上一篇里我已经为大家介绍了关于ControlNet的基本功能、安装和使用技巧,相信大家对这款神级插件已经有了基本认识,今天我会为大家更详细的介绍14种官方控图模型的差异和使用技巧,以及...
-
弹幕背后:B站UP主创作服务解析
引言 在B站,每一条飘过的弹幕都是一个故事的碎片,它们汇聚成一幅幅生动的社交画卷。这里,不仅仅是一个视频分享平台,弹幕背后更是一个充满活力的创作者生态系统。B站以其独特的弹幕文化,为创作者和观众之间搭建起了一座互动的桥梁,让创意与情感在虚拟空间中自由...
-
探索法律智能的新高度:Lawyer LLaMA 项目深度解析
探索法律智能的新高度:Lawyer LLaMA 项目深度解析 lawyer-llama中文法律LLaMA (LLaMA for Chinese legel domain 项目地址:https://gitcode.com/gh_mirrors/la/la...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶 笔记
在夏令营第四期Task1时,我们已经跑通了baseline,本期目的是对baseline的代码有一个更加细致的理解,学习如何借助AI来提升我们的自学习能力,理解每行代码的意思,从大模型提问技巧来实现自主学习,并学习如何制作一个连环画。 首先认识大语言模型...
-
ACM MM2024 | 网易伏羲多模态研究再获国际认可,推动特定领域跨模态理解新突破
近日,第32届ACM国际多媒体学术会议(ACM International Conference on Multimedia,简称ACM MM)公布论文接收结果,网易伏羲最新研究成果《Selection and Reconstruction of Key...
-
Datawhale X 魔搭 AI夏令营 - AIGC方向(task01笔记)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、基础知识 二、实现步骤 1.克隆存储库: 2. 安装环境,然后重启kernel 3. 调整prompt 总结 前言 赛题介绍...
-
【扩散模型】DDPM论文理解
DDPM(Denoising Diffusion Probabilistic Models) 更详细解读可以参考(这几个视频看完基本对DDPM的原理就能够把握了) 李宏毅大白话AIb站公式推导1b站公式推导2 基本过程...
-
深度解析|AI绘画中SD1.5、SDXL、Checkpoint、Lora 的含义与原理
大家好,我是程序员晓晓 自接触AI绘画以来,我发现很多朋友对一些基础词汇理解地很模糊,然后在搭建ComfyUI 工作流或者使用SD WebUI进行出图时,只能知其然,不知其所以然的感觉,也不知搭选哪个模型,很多时候都是照猫画虎地模仿,很难受。而且,很多时...
-
Dreambooth-Stable-Diffusion 使用教程
Dreambooth-Stable-Diffusion 使用教程 Dreambooth-Stable-DiffusionImplementation of Dreambooth (https://arxiv.org/abs/2208.12242 by...
-
Datawhale AI 夏令营 “AIGC”方向 Task1:从零入门AI生图原理&实践
Task1:从零入门AI生图原理&实践 提示:本文为对平台文档的解读注释和补充 Task1:从零入门AI生图原理&实践 Task1:从零入门AI生图原理&实践 文生图 LoRA 提示词 模型参数解读和测试...
-
Llama改进之——分组查询注意力
引言 今天介绍LLAMA2模型引入的关于注意力的改进——分组查询注意力(Grouped-query attention,GQA 1。 Transformer中的多头注意力在解码阶段来说是一个性能瓶颈。多查询注意力2通过共享单个key和value头,同...
-
WhisperX 安装与使用指南
WhisperX 安装与使用指南 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音识别和语音...
-
ControlNetPlusProMax来袭:SDXL可控性灵魂CN组件再升级,多合一组件再添新功能
大家好我是安琪!!! 在数字图像生成领域,ControlNetPlusProMax的推出无疑是一次重大突破。作为SDXL的可控性灵魂CN组件的升级版,ControlNetPlusProMax在多合一组件的基础上,增添了更多实用新功能,为你的创意绘画之旅带...
-
AI写作,让创意飞起来:五款超实用AI写作工具推荐
在现实生活中,除了专业的文字工作者,各行各业都避免不了需要写一些东西,比如策划案、论文、公文、讲话稿、总结计划……等等。而随着科技的进步,数字化时代的深入发展,AI已经成为日常工作中必不可少的工具了,很多人都会借助AI来创作自己需要的文字稿。 自从GPT...
-
【AI绘画】分享个人 AI 绘画心得:Stable diffusion 入门引导教程
大家好,我是设计师子衿。 最近网络上已经有许多朋友都开始自己动手AI绘画,但是又不知道如何入手。在这里我稍微给大家引导入门。 一、AI绘图电脑配置 搞AI绘图,首先是要看自己的电脑配置,如果是配置太低的电脑就不建议玩AI绘图了。 Stable Di...
-
Ai 绘画Stable Diffusion零基础入门——AI 绘画模型推荐(含二次元和真人系列)
对于一位成熟的 AI 画手而言,模型是永远不够用的。人类的绘画风格有平涂、厚涂、写实、抽象之分,而在不同的模型下,AI 对色彩、线条、光影的表达形式也不尽相同。因此,找模型是每一位 AI 画手的必修课。 基础模型 在我们入门阶段,一般接触到最多的是这两...
-
基础模型在亚马逊的BEDROCK测试
前 言 通过 Amazon Bedrock,开发者可以轻松使用多种最新领先基础模型(FM)进行构建。本实验中,您将了解和体验到在 Amazon Bedrock 中模型的基础使用方法,以便您快速构建强大安全的大语言模型(LLM)应用,其中包括:...
-
一文理解生成式AI应用的五个级别:Tool、Chatbot、Copilot、Agent 和 Intelligence
当下,很多人对 AI 一知半解,并不能很好地区分:Tool、Chatbot、Copilot、Agent 和 Intelligence 概念之间的区别。 最近读完 《真格基金戴雨森谈生成式AI:这是比移动互联网更大的创业机会,开始行动是关键 》 发现讲的特别...
-
树莓派4B部署及测试llamafile
重点:不要用树莓派的官方镜像(至少20240808目前的还不支持llamafile,会报错llamafile: prog mmap failed w/ errno 12),查看llamafile github项目下别人的做法是重新换成Ubuntu serv...
-
介绍 Whisper 模型
介绍 Whisper 模型 Whisper 是一个通用的语音识别模型。它在大规模多样化的音频数据集上进行训练,并且能够执行多任务处理,包括多语言语音识别、语音翻译和语言识别。 核心方法 Whisper 使用的是 Transformer 序列到序列...
-
通过剪枝与知识蒸馏优化大型语言模型:NVIDIA在Llama 3.1模型上的实践与创新
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同...
-
Stable Diffusion室内设计提示词怎么写,傻瓜式AI教程
Hello, 大家好,欢迎来到新一期的Stable Diffusion教程。今天我们来谈谈提示词的写作方法。 我们必须看看我以前发表过的文章。虽然当时是针对Migrini的,写了一个提示词写的逻辑,但是原理是一样的。本期主要讲一些SD提示词中的写法和一些...
-
7天创收10万美金,新增25万用户,Wordware要做第一款AI OS
“每天发那么多推文,是想以量取胜吗?可惜质量没有跟上。你的深度分析就像把别人的观点重新包装了一下。” “每天都在转发那些你半懂不懂的AI新闻,是想让我们相信你真的懂吗?55000多个粉丝?我打赌他们一半都是机器人。你对AI的痴迷程度,让我怀疑你是不是想把自...
-
Llama-2-Open-Source-LLM-CPU-Inference 使用教程
Llama-2-Open-Source-LLM-CPU-Inference 使用教程 Llama-2-Open-Source-LLM-CPU-InferenceRunning Llama 2 and other Open-Source LLMs on...
-
AI日报:Captions推出AI视频API套件;国产人形机器人成养老新希望;百度已有18%搜索结果由AI生成
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Captions公司发布AI视...
-
JuiceFS 在多云架构中加速大模型推理
在大模型的开发与应用中,数据预处理、模型开发、训练和推理构成四个关键环节。本文将重点探讨推理环节。在之前的博客中,社区用户 BentoML 和贝壳的案例提到了使用 JuiceFS 社区版来提高模型加载的效率。本文将结合我们的实际经验,详细介绍企业版在此场景...
-
使用Python和Pillow创建照片马赛克应用
在这篇博客中,我们将探讨如何使用Python创建一个简单而有趣的桌面应用程序。我们的目标是构建一个应用,允许用户选择一张照片,然后在照片的右下角添加马赛克效果。这个项目将展示如何结合使用wxPython来创建图形用户界面(GUI 和Pillow库来处理图像...
-
全球首个语音指挥FPS AI ,腾讯魔方携最新AI成果亮相科隆展
AI究竟会如何改变游戏?这应该是全球游戏行业近年最为关注的问题之一。在最近正在德国举办的全球最大游戏展—科隆游戏展上,腾讯游戏魔方工作室群技术中心联合《暗区突围:无限》项目组,首次对外公布其全球首个语音指挥FPSAIF.A.C.U.L.的技术Demo。这是...
-
AI二创「黑神话」点燃全网!爆改二郎神,送自家狗子一键「成精」
【新智元导读】国产3A顶流《黑神话·悟空》,与AI联动起来了!网友纷纷开启二创,有人用AI续写神话,有人把自家二哈变成了精怪,甚至还有人自制了桌面壁纸! 全球玩家鏖战《黑神话·悟空》! 已经有打通关的玩家了,我不羡慕,因为通关后的空虚寂寞马上就会找上你们。...
-
「深度探索:AIGC——从文本到视觉的奇迹之旅」
文章目录 1. 探讨AIGC技术的发展现状和未来趋势 1.1 引言 1.1.1 定义AIGC 1.1.2 重要性与应用领域 1.1.3 文章目的 2. AIGC技术的发展历程 2.1 起源与早期阶段 2.2 技术突破 2.2.1 深...
-
Stable Diffusion赋能“黑神话”——助力悟空走进AI奇幻世界
《黑神话:悟空》是由游戏科学公司制作的以中国神话为背景的动作角色扮演游戏,将于2024年8月20日发售。玩家将扮演一位“天命人”,为了探寻昔日传说的真相,踏上一条充满危险与惊奇的西游之路。 同时,我们还可以借助AI绘画技术,让悟空这一角色踏入AI构成的奇幻...
-
Stable Diffusion | Gradio界面设计及webUI API调用
本文基于webUI API编写了类似于webUI的Gradio交互式界面,支持文生图/图生图(SD1.x,SD2.x,SDXL),Embedding,Lora,X/Y/Z Plot,ADetailer、ControlNet,超分放大(Extras),图片信...
-
1张Nvidia A100 80G部署Lamma3 70b 4bit的性能测试
这里写自定义目录标题 硬件 部署模型 硬件性能监控工具 GPU监控工具 CPU和系统内存监控工具 部署框架 命令 测试脚本与结果 输出定量token测试 prompt 脚本 Test Result 输入定量token测试 prom...
-
SonarQube前后端代码质量分析实战
X项目backend代码分析 C#(.net7)代码分析 Release 6.0.0 · SonarSource/sonar-scanner-msbuild · GitHub下载sonar-scanner-6.0.0.81631-net.zip,解...
-
OpenAI反对美国SB-1047法案,会杀死开源大模型!
OpenAI向美国加州参议员Scott Wiener写了一封反对SB1047法案的信。 SB1047是美国加州在今年2月7日拟定的一项针对开源大模型的法案,其中有非常多不合理的条款,例如,如果有人微调了Meta最新发布的Llama-3.1模型,去开发一些恶...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 Task2:精读代码,实战进阶 Part1:磨刀准备一一认识通义千问 会用ChatGpt就行 Part2:精读baseline——从零入门AI生图 1. 代码的主体架构...
-
AI智能体,年轻人的情感搭子
「AI智能体太好了,现实生活当中,我永远没办法得到永远不变的爱。」这是一位网友使用AI情感陪伴类App后的真实感受。 现在每月都有成百上千万的年轻人,近乎沉醉地与各种AI智能体对话。 他们每月花费在这些软件上的时间,甚至超过一周。他们把智能体当做恋人、朋友...
-
LLMs之Llama Coder:llama-coder的简介、安装和使用方法、案例应用之详细攻略
LLMs之Llama Coder:llama-coder的简介、安装和使用方法、案例应用之详细攻略 目录 llama-coder的简介 1、特点 llama-coder的安装和使用方法 1、安装 推荐硬件 本地安装 远程安装 模型...
-
Anthropic工程师分享沉浸式体验,和「AI搭子」Claude共度完美一天
【新智元导读】沉浸式体验Anthropic提示词工程师与「完美拍档」Claude共度的一天! AI聊天机器人只能用来写文案和找资料? 那说明你对AI工具的开发还不到1%! 昨天,Anthropic工程师Alex Albert,在X上分享了他如何与「AI搭子...
-
阿里开源语音大模型CosyVoice:3秒还原声音,从部署到克隆的完整指南
前言 很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ,但是看到视频教程过于复杂了,最近又出现了一个剪辑《人民的名义》的短视频非常搞笑。 我就找到了一款最新更加强大的声音克隆项目CosyVoice。CosyVoice 是阿里通义实验室在七...