-
20240202在Ubuntu20.04.6下使用whisper.cpp的显卡模式
20240202在Ubuntu20.04.6下使用whisper.cpp的显卡模式 2024/2/2 19:43 【结论:在Ubuntu20.04.6下,确认large模式识别7分钟中文视频,需要356447.78 ms,也就是356.5秒,需要大概5...
-
【综合案例】百变写真:人物不变,换背景(AI写真/固定人物换背景/商业案例教程/喂饭级教程/Stable Diffusion WebUI)
案例教程链接,感觉不错,记得帮我一键三连哦~【AI写真!人物不变,换背景】https://www.bilibili.com/video/BV1xj411i7eN/?vd_source=f4ff2eb7df8662606b1aca0f116eb1a1...
-
Stable Diffusion~自注意力替换技术
在这篇文章中,作者展示了一个较为复杂的基于 Diffusers 开发的自注意力替换示例项目,用于提升 SD 视频生成的一致性。在这个过程中,作者讲述了 AttentionProcessor 相关接口函数的使用,并了解了如何基于全局管理类实现一个代码可维护性...
-
怎么调用文心一言的api接口生成一个简单的聊天机器人(python代码)
寒假在学习大模型,但也没弄出多少眉目,电脑性能还有点小问题,大模型总跑不起来,只会简单调用一下现有的大模型的接口,例如:文心一言,下面展示一下代码: import tkinter as tk import requests import json #此...
-
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
广阔的战场,风暴兵在奔跑…… prompt:Wide shot of battlefield, stormtroopers running... 这段长达 1200 帧的 2 分钟视频来自一个文生视频(text-to-video)模型,尽管 AI 生成...
-
超越GPT-4,Claude 3超大杯成新王!
太疯狂了!Claude 3 Opus超越了GPT-4,成为新的国王! 今天,Chatbot Arena更新了聊天机器人对战的排行榜,在经过了时间的洗礼和群众的检验之后,之前略逊于GPT-4的Claude 3竟然反超了! 而且不仅仅是Claude 3的超...
-
Github Copilot 工具,无需账号,一键激活
① 无需账号,100%认证成功!0风险,可联网可更新,,支持copilot版本升级,支持chat ② 支持windows、mac、linux系统等设备 ③一号通用,支持所有IDE(AppCode,CLion,DataGrip,GoLand,Intelli...
-
生成式AI指南体验入口 awesome-generative-ai-guide项目地址入口
awesome-generative-ai-guide是一个集中存放生成式人工智能相关资源的中心,包括每月最新研究论文、面试题库、课程材料、代码笔记本等。内容定期更新,旨在让开发者及从业人员能够及时跟进最新进展,提高生产力。主要资源包括论文摘要、面试问题分...
-
Stable Diffusion生成式扩散模型代码实现原理
Stable Diffusion可以使用PyTorch或TensorFlow等深度学习框架来实现。这些框架提供了一系列的工具和函数,使得开发者可以更方便地构建、训练和部署深度学习模型。因此可以使用PyTorch或TensorFlow来实现Stable Di...
-
Video-LLaMa:利用多模态增强对视频内容理解
在数字时代,视频已经成为一种主要的内容形式。但是理解和解释视频内容是一项复杂的任务,不仅需要视觉和听觉信号的整合,还需要处理上下文的时间序列的能力。本文将重点介绍称为video - llama的多模态框架。Video-LLaMA旨在使LLM能够理解视频中的...
-
Midjourney学习(四)光源类型prompt
序号 类别 光线名称 英文名称 描述 用途 示例 1 光线质地 硬光 Hard Light 直接照射在主题上,产生明显的阴影和高对比度。 强调轮廓,增加照片的戏剧性 2 光线质地 软光/柔光 Soft Light 光线经过散射...
-
AIGC工具-Stable Diffusion安装指南
Stable Diffusion Web UI安装教程 简介 这是一款ai学习的作图模型训练,github的官网地址是https://github.com/AUTOMATIC1111/stable-diffusion-webui 参考上面的gi...
-
【精华】AIGC启元2024
文章目录 AIGC 前沿 (1 Gemini 1.5 Pro(谷歌新一代多模态大模型) (2 Sora(文本生成视频大模型) (3 EMO(阿里生成式AI模型) (4 Playground v2.5(文生图大模型) (5 VSP-L...
-
用户群组分析Cohort、RFM分层模型、KMeans用户聚类模型对比实战
本文转载自微信公众号「 尤而小屋」,作者尤而小屋 。转载本文请联系尤而小屋公众号。 大家好,我是Peter~ 本文介绍用户群组分析Cohort analysis、RFM用户分层模型、Kmeans用户聚类模型的完整实施过程。 部分结果显示: (1)群组分析...
-
【鸿蒙开发】之集成文心一言或GPT
目录 在鸿蒙应用开发中,要集成文心一言或GPT功能,可以按照以下步骤进行: 案例分析: 在鸿蒙应用开发中,要集成文心一言或GPT功能,可以按照以下步骤进行: 了解文心一言或GPT功能:首先要对文心一言或GPT功能有一定的了...
-
LLM大模型之基于SentencePiece扩充LLaMa中文词表实践
LLM大模型之基于SentencePiece扩充LLaMa中文词表实践 目前大模型的词表和分词器都是基于SentencePiece工具实现的,比如LLaMa,BLOOM,ChatGLM,Baichuan等,简单来说SentencePiece就是工程化的...
-
stable-diffusion-webui中stability的sdv1.5和sdxl模型结构config对比
sdv1.5 v1-inference.yaml model: base_learning_rate: 1.0e-04 target: ldm.models.diffusion.ddpm.LatentDiffusion params:...
-
谈谈我对 AIGC 趋势下软件工程重塑的理解
作者:陈鑫 今天给大家带来的话题是 AIGC 趋势下的软件工程重塑。今天这个话题主要分为以下四大部分。 第一部分是 AI 是否已经成为软件研发的必选项;第二部分是 AI 对于软件研发的挑战及智能化机会,第三部分是企业落地软件研发智能化的策略和路径,第四...
-
CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术
视频理解的核心目标在于对时空表示的把握,这存在两个巨大挑战:短视频片段存在大量时空冗余和复杂的时空依赖关系。尽管曾经占主导地位的三维卷积神经网络 (CNN 和视频 Transformer 通过利用局部卷积或长距离注意力有效地应对其中之一的挑战,但它们在...
-
AI绘画怎么玩?Midjourney教程来啦!
前言 — 随着 ChatGPT 的热度席卷全网,越来越多人开始关注 AIGC(AI Generated Content)的相关应用。其中,人工智能绘画尤为受欢迎,吸引了众多设计师和艺术爱好者的关注。 其中Midjourney 是一款强...
-
国产Copilot--通义灵码安装教程
文章目录 在 Visual Studio Code 中安装通义灵码 步骤1 步骤2 步骤3 步骤4 参考 在 Visual Studio Code 中安装通义灵码 通义灵码,是一款基于通义大模型的智能编码辅助工具,提供行级/函...
-
AIGC时代下阿里云视频云媒体内容生产技术实践
编者按 AIGC时代下,媒体内容生产领域随着AI的出现也涌现出更多的变化与挑战。面对AI的巨大冲击,如何优化或重构媒体内容生产技术架构?在多样的应用场景中媒体内容生产技术又有着怎样的实践效果?LiveVideoStackCon2023...
-
用Stable Diffusion生成同角色不同pose的人脸
随着技术的不断发展,我们现在可以使用稳定扩散技术(Stable Diffusion)来生成同一角色但不同姿势的人脸图片。本文将介绍这一方法的具体步骤,以及如何通过合理的提示语和模型选择来生成出更加真实和多样化的人脸图像。 博客首发地址:用Stable D...
-
视觉AIGC元年:技术大爆炸!Dalle-3、Sora、Stable Diffusion 3 掀起AIGC新浪潮,究竟有哪些模块值得借鉴!
随着科技的飞速发展,我们迎来了视觉AIGC高光时刻,一个充满无限可能与机遇的新时代。在这个时代里,三大里程碑Dalle-3、Sora和Stable Diffusion 3以其炸裂式的技术发展,引领着AIGC领域的新浪潮。文章首先做相应简要介...
-
探索stable diffusion的奇妙世界--01
目录 1. 理解prompt提示词: 2. Prompt中的技术参数: 3. Prompt中的Negative提示词: 4. Prompt中的特殊元素: 5. Prompt在stable diffusion中的应用: 6. 作品展示:...
-
相机与激光雷达是怎么标定的?一览行业所有主流的标定工具
本文经自动驾驶之心公众号授权转载,转载请联系出处。 相机与激光雷达的标定是很多任务的基础工作,标定精度决定了下游方案融合的上限,因为许多自动驾驶与机器人公司投入了较大的人力物力不断提升,今天也为大家盘点下常见的Camera-Lidar标定工具箱,建议收...
-
OpenAI CEO 表示GPT-5的发布将带来令人激动的事情
一年前,OpenAI 公司发布了当时最先进的人工智能模型 GPT-4,让人们惊叹不已。自那时起,人们都在猜测下一个版本 GPT-5何时发布,期待它带来的重大飞跃。尽管 OpenAI 公司的首席执行官 Sam Altman 迄今尚未透露任何消息,但本周我们首...
-
游戏NPC“活”了,英伟达AI立大功
智能NPC,已经承担起推动游戏主线的任务了! 育碧的一个DEMO中,两名个性鲜明的智能NPC带着玩家,在游戏世界中畅游了十五分钟。 不仅对话过程流畅、表情动作自然,而且还最新支持了多轮对话。 最关键的是,与NPC的对话不再只是闲聊,而是时时刻刻在推进主...
-
11个历史新高,大模型有望追平GPT4、继续探索游戏业务| 快手财报解读
快手联合创始人兼 CEO 程一笑表示,“2023年,快手不断深化内容和商业生态建设,开启了全面盈利的新篇章。2023年全年经调整后净利润也首次突破百亿大关,Q4MAU 突破了7亿,创历史新高。展望2024年,将进一步优化基于信任社区建设的内容和商业生态,致...
-
本地用AIGC生成图像与视频
最近AI界最火的话题,当属Sora了。遗憾的是,Sora目前还没开源或提供模型下载,所以没法在本地跑起来。但是,业界有一些开源的图像与视频生成模型。虽然效果上还没那么惊艳,但还是值得我们体验与学习下的。 Stable Diffusion(SD)是比较流行...
-
AtomoVideo:AIGC赋能下的电商视频动效生成
✍🏻 本文作者:凌潼、依竹、桅桔、逾溪 1. 概述 当今电商领域,内容营销的形式正日趋多样化,视频内容以其生动鲜明的视觉体验和迅捷高效的信息传播能力,为商家创造了新的机遇。消费者对视频内容的偏好驱动了视频创意供给的持续增长,视觉内容...
-
一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前...
-
还在为写论文焦虑?免费AI写作大师帮你三步搞定!
还在为写论文焦虑?免费AI写作大师-AI帮你三步搞定! 智元兔AI是ChatGPT的人工智能助手,并且具有出色的论文写作能力。它能够根据用户提供的题目或要求,自动生成高质量的论文。 不论是论文、毕业论文、散文、科普文章、新闻稿件,还是商业文案、推广...
-
奥特曼回应了OpenAI的一切,剧透GPT-5发布
难得难得!关于GPT-5细节以及OpenAI更多内幕,竟然被奥特曼自曝了。 GPT-5会是整个性能全面提升,会超出预期;对正研究如何提升GPT-4的初创公司会是一种碾压。 如果回到过去,我会考虑换掉“OpenAI”这个名字。 计算能力将会成为世界上最...
-
为何大语言模型不会取代码农?
译者 | 布加迪 审校 | 重楼 生成式人工智能(GenAI)会取代人类程序员吗?恐怕不会。不过,使用GenAI的人类可能会取代程序员。但是如今有这么多的大语言模型(LLM),实际效果不一而足。 如果您在努力跟上所有LLM,并非只有您一个人。我们目睹一...
-
图解CodeWhisperer的安装使用
🎬 江城开朗的豌豆:个人主页 🔥 个人专栏 :《 VUE 》 《 javaScript 》 📝 个人网站 :《 江城开朗的豌豆🫛 》 ⛺️ 生活的理想,就是为了理想的生活 ! 目录 📘 CodeWhisperer简介...
-
chatGPT的耳朵!OpenAI的开源语音识别AI:Whisper !
语音识别是通用人工智能的重要一环!可以说是AI的耳朵! 它可以让机器理解人类的语音,并将其转换为文本或其他形式的输出。 语音识别的应用场景非常广泛,比如智能助理、语音搜索、语音翻译、语音输入等等。 然而,语音识别也面临着很多挑战,比如不同的语言、口音...
-
今日AI:suno v3模型要抢歌手饭碗?字节发布AnimateDiff-Lightning模型;谷歌发布Vlogger视频模型;博主用AI做长篇漫画上架腾讯
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 歌手也要失业了?...
-
C# RAM Stable Diffusion 提示词反推 Onnx Demo
目录 介绍 效果 模型信息 项目 代码 下载 C# RAM Stable Diffusion 提示词反推 Onnx Demo 介绍 github地址:GitHub - xinyu1205/recognize-anything: Open...
-
Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放
Stability AI 的大模型家族来了一位新成员。 昨日,Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后,又为社区带来了 3D 视频生成大模型「Stable Vi...
-
在VSCode中使用GitHub Copilot Chat
GitHub Copilot Chat 是一个扩展,可以在你的代码编辑器或IDE(目前是VS Code或Visual Studio 中工作,允许你从编辑器中与 GitHub Copilot 进行对话。 开始 要开始使用 GitHub Copilot C...
-
AIGC绘画关键词 - 二次元少女
Unity3D特效百例 案例项目实战源码 Android-Unity实战问题汇总 游戏脚本-辅助自动化 Android控件全解手册 再战Android系列 Scratch编程案例 软考全系列 Unity3D学习专栏 蓝桥系列 ChatGPT和...
-
Stable Diffusion V3测评
1.引言 3月5号,Stability AI发布了介绍Stable Diffusion V3的研究论文,链接地址:戳我 这是目前他们发布的最先进、功能最强大的图像生成器,与一年多前发布的令人印象深刻的 Stable Diffusion V2.1...
-
Amazon CodeWhisperer——AI助力编程
文章目录 一、Amazon CodeWhisperer简介 二、安装Amazon CodeWhisperer 2.1 PyCharm环境(一定要2023版本及以上) 2.1.1 下载插件 2.1.2 注册Amazon账号 2.1.3 Cod...
-
AI新工具(20240312) Midjourney官方发布角色一致性功能;免费且开源的简历制作工具;精确克隆语调、控制声音风格
1: Midjourney角色一致性功能 使人物画像在多方面高度一致成为可能。 Midjourney的角色一致性功能的使用方法如下: ⭐在你的输入指令后面加上 --cref URL,其中URL是你选择的角色图像的链接。 ⭐你可以通...
-
Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩
Stable Diffusion背后公司Stability AI又上新了。 这次带来的是图生3D方面的新进展: 基于Stable Video Diffusion的Stable Video 3D(SV3D),只用一张图片就能生成高质量3D网格。 Stab...
-
帝国CMS采集插件的应用与优化探索
在网络信息高度发达的今天,内容管理系统(CMS)已成为众多网站建设的核心基石,其中帝国CMS作为国内一款知名度较高的CMS系统,受到广泛关注与应用。为了让帝国CMS在使用过程中更为高效地进行内容的获取和发布,“帝国CMS采集插件”这一扩展功能,就在用户的需...
-
AI在用 | 数学更生动,Claude-3直接生成勾股定理动画
以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。 今天,我们分享 X 平台用户 @dr_cintas 使用 Claude3(具体版本不详)生成勾股定理动画的用例。 案例地址:https:/...
-
基于Google Vertex AI 和 Llama 2进行RLHF训练和评估
Reinforcement Learning from Human Feedback 基于Google Vertex AI 和 Llama 2进行RLHF训练和评估 课程地址:https://www.deeplearning.ai/short-cou...
-
AIGC元年大模型发展现状手册
零、AIGC大模型概览 AIGC大模型在人工智能领域取得了重大突破,涵盖了LLM大模型、多模态大模型、图像生成大模型以及视频生成大模型等四种类型。这些模型不仅拓宽了人工智能的应用范围,也提升了其处理复杂任务的能力。a. LLM大模型通过深度学习和自然语...