-
【小沐学AI】Python实现语音识别(whisperX)
文章目录 1、简介 1.1 whisper 1.2 whisperX 2、安装 2.1 安装cuda 2.2 安装whisperX 结语 1、简介 1.1 whisper https://arxiv.org/pdf/2...
-
AI绘画-Stable Diffusion 原理介绍及使用
引言 好像很多朋友对AI绘图有兴趣,AI绘画背后,依旧是大模型的训练。但绘图类AI对计算机显卡有较高要求。建议先了解基本原理及如何使用,在看看如何实现自己垂直行业的绘图AI逻辑。或者作为使用者,调用已有的server接口。 首先需要说明的是,AI绘图和...
-
讯飞AI写作与python及selenium结合,自动化处理的编写笔记,这是我思考和整理了接近一周才完成的,可能我太笨了。
起因:当ai写作刚开始的时候,我头脑发热,花钱买了一年的。结果发现用手工的方式是不可能用完量的。用模拟操作倒是可以,本着钱不能乱花的原则,我开始想,如何也让python和selenium来完成这项工作。 这个系统和其他的Ai不太一样,一方面他支持问答式,...
-
本地部署Stable Diffusion记录
环境:Windows10 1.安装python 3.10.6,不要装3.11,安装完后,设置python环境变量 Index of python-local/3.10.6 2.安装Git Git 3.clone web-ui 这步骤是下载sta...
-
AIGC实践|用AI制作视频短片创作全流程
前言: 在深入探讨了AI在动态有声绘本和小游戏开发的应用之后,本次我们将聚焦于视频创作领域。本篇文章将详细展示如何使用AI工具从概念构思到画面生成再到最终成片的全过程,涵盖剧本创作、分镜头设计、视觉效果生成及音乐配制等各个阶段。让我们一同启程,再次踏上这...
-
【AI绘画】关于AI绘画做副业,你需要知道的事
前言 AI绘画是一种新兴的艺术形式,它利用人工智能技术来创造出各种各样的艺术作品。随着人工智能技术的不断发展,AI绘画已经成为了一种非常有前途的副业,可以帮助人们赚取额外的收入。下面是一些利用AI绘画副业方法。 1、利用AI绘画技术创作艺术作品...
-
自媒体内容创作ai写作神器:10款你一定要知道的工具! #科技#学习
这些工具不仅可以快速生成高质量的文本内容,还可以根据用户的需求进行个性化定制。它们可以帮助我们节省大量的时间和精力,让我们更加专注于创意和细节的打磨。本文将为大家详细介绍几个AI写作工具,让你在写作领域更上一层楼。 1.元芳写作 这是一个微信公众号...
-
[AIGC] 深入了解Hutool的Dict工具
Hutool是为Java编程语言设计的一系列轻量级通用工具集,其中包含了处理数组、日期、I/O流、加密解密等各种常见的工作场景所需要的工具。 在这其中,Dict是Hutool中一个非常有用的工具,下面我们就来深入了解一下它。 什么是Dict?...
-
【AIGC调研系列】MetaGpt与AutoGpt相比有哪些优势和劣势
MetaGPT与AutoGPT相比,具有以下优势和劣势: 优势: MetaGPT采用了多智能体框架,通过角色专业化、工作流管理和灵活的消息机制,增强了大规模语言模型在多智能体协作上的能力[4]。这种设计使得MetaGPT能够处理更复杂的任务,并通过结...
-
[AIGC] Spring 获取前端请求参数的全面指南
在Spring框架中,我们有多种方式可以获取前端发来的请求参数。以下是一些常用的方法: 文章目录 1. 通过@RequestParam注解 2. 通过HttpServletRequest对象 3. 通过@PathVariable...
-
全网最全讲解Stable Diffusion原理,小白也能看懂!速来!!!
手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。下面是Stable Diffusion注册和使用的方法。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取...
-
图灵奖得主:对AI无动于衷是要被“消灭”的
快科技7月4日消息,在2024世界人工智能大会上,图灵奖得主罗杰瑞迪表示,AI是一个新物种,这个物种比我们人类要强大很多倍。 罗杰瑞迪警告称,面对这样一个强大的存在,如果我们选择无动于衷,那么等待我们的很可能是被AI超越乃至消灭”。 这里的消灭”并非字面意...
-
用AI绘画-Stable Diffusion稳定生成指定人物的2-3人场景图,制作小说配图从未如此轻松!
大家好,我是设计师阿威 最近,尝试在写故事,然后用sd配图。其中,单人场景很容易生成。 但是多人场景的话,很难稳定生成满意的图像。 今天就教大家一招,用additional networks + controlnet openpose,可以稳定生成2...
-
视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等
VideoChat VideoChat?: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...
-
AIGC从入门到实战:只缘身在此山中:GPT 模型靠什么取胜和出圈?
AIGC从入门到实战:只缘身在此山中:GPT 模型靠什么取胜和“出圈”? 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming / TextGenWebUILLM AIGC from Begi...
-
李彦宏:AI不是人类的竞争对手 工作机会正大量诞生
快科技7月4日消息,在2024年世界人工智能大会上,百度董事长兼CEO李彦宏谈及个人对AI的看法。 李彦宏认为,AI在当前及未来发展中,其核心定位是智慧副驾驶”,其角色在于赋能而非取代人类。他精辟地指出:AI是人类的得力助手,旨在提升工作效率与成果质量,而...
-
文生图王者登场:Stable Diffusion 3 Medium正式开源
今年2月,Stability.ai发布了Stable Diffusion 3预览版,在多主题提示、图像质量和拼写能力方面具有显著的性能提升。Stable Diffusion 3是一个系列模型,参数量从800M到8B不等。 6月12日,Sta...
-
比尔盖茨:白领比蓝领更早被AI取代
快科技7月4日消息,在近日做客播客节目时,比尔盖茨对人工智能的未来进行了深入探讨,并表示白领工作比蓝领工作更早受到人工智能的替代。 盖茨指出,尽管人工智能在许多领域展现出巨大潜力,但它同时也带来了一些挑战,特别是在就业领域。 他观察到一个趋势,受教育程度较...
-
AI版沪上“繁花”上演,腾讯构建离产业最近的人工智能
作为新一轮科技革命和产业变革的重要驱动力量,人工智能被认为是发展新质生产力的主要阵地。7月4日,以“以共商促共享,以善治促善智”为主题的2024世界人工智能大会在上海开幕。 连续七届参加大会的腾讯,今年聚焦“用AI助力美好生活,构建离产业最近的AI”这一...
-
文献研读|AIGC溯源场景及研究进展
前言:本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。 相关文章:针对文生图模型的AIGC检测论文研读,参见此篇文章。 如下图所示,在AIGC生成阶段,有4种溯源场景: 1)生成模型溯源训练数据 2)微调模型溯源预训练模型 3)AI...
-
8人半年肝出开源版GPT-4o,0延迟演示全网沸腾!背后技术揭秘,人人免费用
【新智元导读】GPT-4o或许还得等到今年秋季才对外开放。不过,由法国8人团队打造的原生多模态Moshi,已经实现了接近GPT-4o的水平,现场演示几乎0延迟,AI大佬纷纷转发。 没想到,「开源版」GPT-4o这么快就来了! 昨夜,来自法国AI实验室kyu...
-
两周用户增长近百万,挺进美国社交应用榜Top5,这款反AI产品火了
在AI产品竞争白热化之际,一款反AI应用却逆势走红。 今年6月,一个名为Cara的图片社区仅用了两周时间,就将用户基数从四万增长至近百万,一跃成为美国社交应用榜Top5,超过了X(前为“推特”)、Reddit、Discord、Linkedln和Messen...
-
一文为你深度解析LLaMA2模型架构
本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课 大咖深度解析LLaMA2 模型架构》,作者: Freedom123。 一、前言 随着人工智能技术的不断发展,自然语言处理(NLP)领域也取得了巨大的进步。在这个领域中,LLaMA展...
-
推荐一款革命性代码助手 - Ollama Copilot
? 推荐一款革命性代码助手 - Ollama Copilot 在程序员的世界里,一个好的辅助工具就像是一位智慧的导师,能指引我们突破编程的迷雾,让代码书写变得轻松而高效。今天,我将为大家带来一个全新的开源项目——Ollama Copilot。它不仅融合了...
-
猫头虎分享如何使用AIGC一键生成爆款公众号文案?
猫头虎分享如何使用AIGC一键生成爆款公众号文案? 前言 在自媒体时代,如何撰写一篇能引发广泛分享、获得微信平台推荐的爆款文章,是每一位公众号作者追求的目标。今天,猫头虎将为大家揭秘如何利用AIGC(人工智能生成内容)工具,一键生成高质量的公众号文...
-
Meta推出AI新模型:1分钟内生成高质量3D素材
快科技7月4日消息,据媒体报道,科技巨头Meta震撼发布了其前沿AI创新成果Meta 3D Gen(简称3DGen),这一突破性技术能够在极短的时间内,即不足1分钟,迅速孕育出令人瞩目的高质量3D素材,极大地加速了创意内容生产的进程。 Meta表示,3DG...
-
开源大模型 Llama 3
开源大模型Llama 3是一个在多个领域都展现出卓越性能的大模型。下面将为您介绍Llama 3的特性和一些简单的使用案例。 一、Llama 3介绍 Llama 3在Meta自制的两个24K GPU集群上进行预训练,使用了超...
-
全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队出手了
【新智元导读】最近,公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试!各种直击打工人的灵魂拷问,让所有i人和e人在职场极限场景中反复拉扯。国产黑马和上影打造的原汁原味《大闹天宫》画风,简直让人一秒穿越回童年。 就在最近,全公司都为这个大闹天宫MBTI测...
-
Amuse .NET application for stable diffusion
Amuse github地址:https://github.com/tianleiwu/Amuse .NET application for stable diffusion, Leveraging OnnxStack, Amuse seamlessl...
-
AI日报:对标GPT-4o!开源大模型Moshi登场;Google Pixel 9新增多个AI功能;ElevenLabs发布消音神器VOICE ISOLATOR
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、对标GPT-4o!开源大模型M...
-
超简单!用AWS的Bedrock对Llama进行微调
哎,微调?听起来超难的! 对吧。不过,用Amazon Bedrock的话,其实挺简单的。 Customize models in Amazon Bedrock with your own data using fine-tuning and conti...
-
史上最走心midjourney教程&多案例咒语&注意点
一 :什么是Midjourney ?(文末附 MidJourney 知识库,从注册到使用教程还有高阶技巧应有尽有。) Midjourney是一个由同名研究实验室开发的人工智能程式,可根据文本生成图像,于2022年7月12日进入公开测试阶段,使用者可透过D...
-
比尔盖茨最新预言:耳机和眼镜才是AI硬件重点
快科技7月4日消息,微软联合创始人比尔盖茨在最新一期的《下一个伟大的构想》播客节目中,分享了他对人工智能未来趋势看法。 盖茨预言,人工智能技术的普及将深刻改变我们的生活和工作方式,而耳机和智能眼镜将成为AI硬件的两个重点领域。 盖茨认为,耳机不仅仅是音频播...
-
第二十篇-推荐-纯CPU(E5-2680)推理-llama.cpp-qwen1_5-72b-chat-q4_k_m.gguf
环境 系统:CentOS-7 CPU: Intel® Xeon® CPU E5-2680 v4 @ 2.40GHz 14C28T 内存: 48G DDR3 依赖安装 make --version GNU Make 4.3 gcc --versi...
-
【LLM教程-llama】如何Fine Tuning大语言模型?
今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning !(代码和详细解释放在后文) 目录 大语言模型进行微调(Fine Tuning 需要哪些步骤? 大语言模型进行微调(Fine Tuning 训练过程及代码...
-
【OrangePi AIpro】香橙派 AIpro运行大模型之Stable diffusion与 llama2
前言:在学生年代,小编用过香橙派4B、树莓派3B、树莓派4B、ROCK Pi4等开发板,每次拿到新开发板的时候,总会迫不及待地装上系统,当做一个小型电脑玩上一波,然后再将一些功能在上面实现或者将算法部署到上面,体验下性能的提升,相信每一个技术爱好者都如此,...
-
比尔盖茨最新访谈:现在对AI的狂热远超互联网泡沫!
快科技7月4日消息,微软联合创始人比尔盖茨近日在做客知名播客节目《下一个伟大的构想》时,对人工智能的未来进行了深入讨论,并提出了超人类人工智能的构想。 盖茨作为科技界的领航者,曾在1980年预言每个办公桌上都会有一台电脑,而他最新预言是每个人的耳边都将配备...
-
【AI原理解析】— 文心一言模型
目录 模型架构 Transformer模型 编码器-解码器结构 训练过程 预训练 微调 关键技术 知识增强 上下文感知 个性化生成 推理与生成 应用场景 问答系统 文本生成 对话系统 模型架构 Trans...
-
vue前端实现导出页面为word(两种方法)
将vue页面导出为word文档,不用写模板,直接导出即可。 第一种方法(简单版 第一步:安装所需依赖 npm install html-docx-js -S npm install file-saver -S 第二步:创建容器,页面使用...
-
AI 技术创新可以有多硬核? GOTC 2024 论坛议程抢先看
8 月 15 日至 16 日,GOTC 2024 将在上海张江科学会堂盛大开启。GOTC 2024 与上海浦东软件园联合举办,并结合 “GOTC(全球开源技术峰会)” 与 “GOGC(全球开源极客嘉年华)”,旨在打造一场全新的开源盛会。2024 全球开源极...
-
央视点赞国产AI复活召唤术,兵马俑竟与宝石老舅对唱Rap?
沉睡了两千多年的兵马俑,苏醒了? 一句秦腔开场,将我们带到了黄土高原。如果不是亲眼所见,很多观众可能难以想象,有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。 「青海长云暗雪山,孤城遥望玉门关。」古调虽存音乐变,声音依旧动人情: 这场表演背后的...
-
苹果联手OpenAI何惧!周鸿祎:华为像是苹果微软英伟达结合体
快科技7月4日消息,近日,周鸿祎谈及苹果与OpenAI联手合作的事,其表示华为应做好算力芯片,打造云服务。 在被问到苹果与OpenAI联手合作,华为有没有其他选择,或者能走出自己的路”时,周鸿祎表示,华为太厉害了,它等于是把苹果、英伟达、OpenAI、亚马...
-
开源之光 Stable Diffusion 3 技术论文全解:公式占一半,实验很充分!
文章链接:https://arxiv.org/pdf/2403.03206 扩散模型通过反转数据到噪声的正向路径来从噪声中创建数据,并已成为处理高维感知数据(如图像和视频)的强大生成建模技术。Rectified flow是一种最近提出的生成模型形式,它将...
-
5分钟教你用AI把老照片动起来,别再去花49块9的冤枉钱了
最近,AI视频在各大平台上,又火了。 只是火的形式,变成了将老照片动起来,打情感牌,或者做很多经典电视剧的再整活。 直接把可灵的生成时间,从以前的4分钟,生生的干成了20分钟。 火的原因,一方面是因为快手可灵的图生视频正式上线,给大家提供了一个工具的基...
-
苹果中国官网上线iOS 18介绍页面:全程未提AI 个性化成最大亮点
快科技7月4日消息,苹果中国官网最新上线了iOS 18介绍页面,详细展示了iOS 18的新设计和新功能。 值得注意的是,页面中全程没有提及iOS 18的最大亮点AI。 苹果在今年WWDC上着重介绍了各种AI功能,并且发布了自家大模型Apple Intell...
-
新手专享!Stable Diffusion WebUI的5款基础插件,必装指南
大家好,我是程序员晓晓 上期我们介绍了Stable Diffusion 云端部署的安装、方式,今天我要继续为大家推荐5款必须安装的插件,它们可以帮助我们更好地使用、管理相关的资源。 一、Localization zh_Hans:中文汉化包 插件地址...
-
iPhone迈入AI时代!Apple Intelligence秋季登场:但有3点遗憾
快科技7月4日消息,据媒体报道,Apple Intelligence将在今年秋季正式登场,iPhone 16系列、iPhone 15 Pro和iPhone 15 Pro Max将首发搭载Apple Intelligence,iPhone正式迈入AI时代。...
-
零基础入坑爬虫—Python网络爬虫的应用实战以及数据采集
前言 简单来说互联网是由一个个站点和网络设备组成的大网,我们通过浏览器访问站点,站点把HTML、JS、CSS代码返回给浏览器,这些代码经过浏览器解析、渲染,将丰富多彩的网页呈现我们眼前; 博主今天有个小目标—带领大家正式入坑爬虫! 想要学习爬虫却一...
-
阿里云DSW做AI绘画时的显卡选择A10?V100?
V100是Volta架构,A10是Ampere架构,架构上讲A10先进点,其实只是制程区别,用起来没区别。 V100是HBM的内存读取,带宽大,但是DDR5的。 二块卡都是全精度为主的算力卡,半精度优势不明显。 需要用大内存的,选A10, 24G用起...
-
Stable Diffusion 3 文本生成图像 在线体验 原理分析
前言 本文分享使用Stable Diffusion 3实现文本生成图像,可以通过在线网页中免费使用的,也有API等方式访问。 同时结合论文和开源代码进行分析,理解其原理。 Stable Diffusion 3是Stability AI开发的最新、最先...