-
房价预测模型代码笔记以及文心一言Q.A记录
导入库方面略过不提 第一部分:简易日期处理模块 def processdate(date : date_num = (int(date[:4] - 2014 *12 + (int(date[4:6] -5 return date_n...
-
【AI绘画·24年1月最新】Stable Diffusion整合包安装!解压即用--秋葉aaaki 大佬的作品,试用
前言 Stable Diffusion 之前费老大的劲部署安装,解决报错。搞完之后,突然发现有个现成集成包可以用,真是效率高到不行,今天搞下来试试 我电脑配置: CPU: 12th Gen Intel® Core™ i7-12700F 2.10 GHz...
-
stable diffusion使用相关
IP Adapter,我愿称之它为SD垫图 IP Adapter是腾讯lab发布的一个新的Stable Diffusion适配器,它的作用是将你输入的图像作为图像提示词,本质上就像MJ的垫图。 IP Adapter比reference的效果要好,而且会...
-
AIGC:语音克隆模型Bert-VITS2-2.3部署与实战
1 VITS2模型 1.1 摘要 单阶段文本到语音模型最近被积极研究,其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展,但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2,一种单阶段的文本到语音模型...
-
把字节当成token,清华和微软刚掏出来的bGPT到底什么来头
相信你或多或少对GPT有一定的了解,但我赌你没听说过bGPT。bGPT的意思是byte GPT,即字节GPT。这是一种专门设计用于处理二进制数据和模拟数字世界的深度学习模型。简单概括,bGPT突破了传统语言模型的局限,能够直接理解和操作二进制数据,拓展了深...
-
如何只用两个Python函数在几分钟内创建完整的计算机视觉应用程序
译者 | 李睿 审校 | 重楼 本文首先概述典型的计算机视觉应用程序的要求。然后,介绍Pipeless这一为嵌入式计算机视觉提供无服务器开发体验的开源框架。最后,提供一个详细的步骤指南,介绍如何创建和执行一个简单的对象检测应用程序,该应用程序只需采用几...
-
利用“meedu采集插件”提升在线教育资源整合效率的研究
在互联网快速发展的今天,大量的在线教育平台应运而生。伴随着市场竞争的加剧和教育者对内容的要求越来越严苛,怎样在这些在线教育平台中有效且高质地收集教学内容变得非常重要。"meedu 采集插件"就是这样一个可以有效解决这个问题的高效采集工具,引起了在线教育工作...
-
蔚来NOMI GPT领航版开启招募 拥有多模态感知能力
蔚来汽车官方宣布,备受瞩目的NOMI GPT领航版现已正式开启招募,标志着2024款蔚来汽车将迈入全新的体验升级阶段。 据了解,NOMI作为蔚来汽车的智能助手,在过去的迭代更新中,已经为用户带来了超过2000项实用功能。经过132次版本迭代,NOMI如今即...
-
轻松玩转AI绘图,可私有化部署的Stable Diffusion
引言 Stable Diffusion 是一个开源的深度学习模型,主要利用文本描述生成高质量的图像,还可以图生图、模型合并、模型训练等。Stable Diffusion 的操作界面如下图所示: 如何生图 下面介绍一下小鹿喝水的生图过程,生成图...
-
不依赖token,字节级模型来了!直接处理二进制数据
最新GPT,不预测token了。 微软亚研院等发布bGPT,仍旧基于Transformer,但是模型预测的是下一个字节(byte)。 通过直接处理原生二进制数据,bGPT将所有输入内容都视为字节序列,从而可以不受限于任何特定的格式或任务。 能预测CPU...
-
不依赖Token,字节级模型来了!直接处理二进制数据
最新GPT,不预测token了。 微软亚研院等发布bGPT,仍旧基于Transformer,但是模型预测的是下一个字节(byte)。 通过直接处理原生二进制数据,bGPT将所有输入内容都视为字节序列,从而可以不受限于任何特定的格式或任务。 能预测CPU...
-
告别繁琐的手动调参,Optuna助您轻松实现超参数优化!
在机器学习和深度学习领域,超参数优化是一个至关重要的任务。通过调整模型的超参数,我们可以提高模型的性能和泛化能力。 然而,手动调整超参数是一项繁琐且耗时的任务,因此自动化超参数优化成为了一种常见的解决方案。 在Python中,Optuna是一个流行的超参...
-
视频采集卡驱动:技术细节与应用全解析
在数字视频处理与传输技术日新月异的今天,视频采集卡作为一种关键的硬件设备,其性能与稳定性直接关乎到视频采集与处理的最终效果。而视频采集卡驱动,作为连接硬件与操作系统的桥梁,更是扮演着至关重要的角色。本文将深入探讨视频采集卡驱动的技术细节、应用场景以及发展趋...
-
本地开启stable diffusion web-ui体验AIGC文生图,图生图
目录 准备工作 主机电脑配置检查 安装以下软件 Python Git 下载stable-diffusion-webui仓库 根据显卡属性安装CUDA 2.下载stable diffusion的训练模型 启动 问题处理 模型加载问题...
-
不到百行代码,使用Whisper进行视频字幕生成。
前言 最近在学习视频剪辑的时候,希望找一款软件进行翻译;发现大多数是调用某云的Api进行翻译。通过查询资料,打算使用Whisper进行本地视频语音的识别,然后进行字幕文件的编辑(srt),最后通过ffmpeg添加到视频中。 Whisper 是...
-
20240202在WIN10下使用whisper.cpp
20240202在WIN10下使用whisper.cpp 2024/2/2 14:15 【结论:在Windows10下,确认large模式识别7分钟中文视频,需要83.7284 seconds,需要大概1.5分钟!效率太差!】 83.7284/420=0...
-
Serge让你在本地运行LLaMa模型
什么是 Serge ? Serge 是基于 llama.cpp 运行 Alpaca 模型的聊天界面。完全自托管,不需要 API 密钥。适合 4GB RAM 并且能在 CPU 上运行。 什么是 LLaMA ? LLaMA 是一种机器学习...
-
Piwigo采集插件:革命性的图像管理方式
在网络多媒体蓬勃发展的时代背景下,各种形式的数字化内容日渐浩瀚如海,人们对于高质量图片的采集和有序化管理的需求不断增强。满足于此一空前强烈的切实之需,"Piwigo采集插件"依托自身特点积极响应号召, 不仅诠释了当今世界网络和用户多元化共同快速成长的关键因...
-
开源C++智能语音识别库whisper.cpp开发使用入门
whisper.cpp是一个C++编写的轻量级开源智能语音识别库,是基于openai的开源python智能语音模型whisper的移植版本,依赖项少,内存占用低,性能更优,方便作为依赖库集成的到应用程序中提供语音识别功能。 以下基于whisper.cpp...
-
Python在数据采集中的速度与优化策略深度分析
在当今时代,数据被视为新的石油或黄金,它的采集与挖掘对于企业的发展、决策,甚至是国家的战略规划都有着重要意义。Python作为一种通用编程语言,凭借其在数据处理和分析领域的独特优势,被广泛应用于数据采集工作。本文将深入讨论Python在数据采集方面的速度表...
-
微软“办公新时代”活动前瞻,主打 AI:新画图应用、提高游戏帧率等
3 月 8 日消息,微软已敲定北京时间 3 月 22 日凌晨 1 点举办线上新品发布会,主题为“办公新时代”,预估主要内容是 Copilot、Windows 和 Surface,利用 AI 提高用户生产力。 根据 Windows Latest 报道,微...
-
C# SwinV2 Stable Diffusion 提示词反推 Onnx Demo
目录 介绍 效果 模型信息 项目 代码 下载 C# SwinV2 Stable Diffusion 提示词反推 Onnx Demo 介绍 模型出处github地址:https://github.com/SmilingWolf/SW-C...
-
dedecms自带的采集
由于您要的是关于“dedecms自带的采集”的一篇2000字的详细分析,这部分的内容会因为具有特殊性的专有知识和有目的地展开后相当地长度庞大。一般答复提供者几乎难在不熟悉某个具体应用的全部情况先写信编纂这个工具的独立批判抑或别稿出来;下方消费LZ和思考的职...
-
PyTorch 该怎么学?太简单了
挺多小伙伴问过PyTorch该怎么学,经过长期实践来看,初学者需要熟知的概念和用法真的不多,以下总结的简明指南一起看看吧! 构建Tensor PyTorch 中的 Tensors 是多维数组,类似于 NumPy 的 ndarrays,但可以在 GPU...
-
whisper 强大且开源的语音转文字
说起来语音转换文字,openai旗下的whisper很是好用,推理也很快,同时支持cpu和GPU。 GitHub:GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Wea...
-
性能8.6倍于竞品!高通AI大揭秘:NPU引领四兄弟无敌
生成式AI的变革,对于基础硬件设计、软件生态开发都提出了新的、更高的要求,尤其是底层硬件和算力必须跟上新的形势,并面向未来发展做好准备。 近日,高通特别发布了《通过NPU和异构计算开启终端侧生成式AI》白皮书,对于终端侧生成式AI的发展趋势,以及高通骁龙处...
-
【AIGC】单图换脸离线版软件包及使用方法
云端再好,都不如放自己手里啊,想怎么就怎么玩。云端再好,都不如放自己手里啊,想怎么就怎么玩。 Roop作为一个新出的开源项目,配置起来还是有一定难度的。 我已经把各种依赖,模型,环境配置已经都弄好了。 另外还放了一个演示素材,人脸版权限制,无法在...
-
传感、人工智能和想象力:视觉如何塑造物联网
视觉正在迅速成为物联网发展的领先传感应用,这正在深刻地改变我们的世界。想想工厂和制造业。计算机视觉系统可以通过确保质量控制、优化流程、减少浪费和推动持续改进来改变现代工厂。这些系统有助于提高生产效率、成本效益和制造业务的竞争力。在Arm最近的一项物联网...
-
AI 绘图 Stable Diffusion 环境安装(Mac、Windows详细流程)
一、简介 Stable Diffusion 与 Midjourney 的区别,个人比较喜欢优点里面的不受约束这条。 二、安装 配置要求 安装 Git 1、【Mac】使用 HomeBrew 进行 快捷安装,文章内部有安装部分(注意如果是...
-
驾辰龙跨Llama持Wasm,玩转Yi模型迎新春
今年新年很特别,AI工具添光彩。今天就来感受下最新的AI神器天选组合“WasmEdge+Yi-34B”,只要短短三步,为这个甲辰龙年带来一份九紫离火运的科技感。 环境准备 这次用的算力是OpenBayes提供的英伟达RTX_4090*1、24GB显存、...
-
天创恒达视频采集卡:视频捕捉技术的杰出代表
随着数字多媒体技术的快速发展,视频采集卡作为连接模拟与数字世界的桥梁,在广播电视、视频会议、医疗影像、教育培训、安防监控等诸多领域都发挥着不可替代的作用。在众多视频采集卡品牌中,“天创恒达”凭借其卓越的性能、稳定的品质及完善的服务体系,成为了业内瞩目的焦点...
-
B站视频爆火新秘籍:up主用AI还原网络热梗获赞超15万
近日,一种全新的网络流行梗在社交媒体上引发了广泛关注。这个梗由抖音博主“延边刺客”首创,通过将一些完全不相关的事物——意大利面、42号混凝土、螺丝钉、挖掘机扭矩等强行组合在一起,制造出一种荒诞、无厘头的幽默风格。 令人惊讶的是,B站UP主“亮仔同学__”利...
-
PPIO王闻宇:论GPU的过去、现在和未来|AIGC基石思考之算力哲学
00 前言:算力与GPU 算力,即计算能力(Computing Power)。更具体来说,算力是通过对信息数据进行处理,实现目标结果输出的计算能力。 最早的算力引擎。是人类的大脑,后来演变成草绳、石头、算筹(一种用于计算的小棍子)、算盘。到...
-
【AI作图】从零开始部署安装Stable Diffusion 2 WebUI【个人总结】
前言 前两天突然想搭建一个AI作图的,但是一脸懵逼,lgithub地址,结果全英也看不懂,只知道了Stable Diffusion,这两天去了解了下,想要网页版就Stable Diffusion WebUI,在自己笔记本上尝试搭建,找了各种...
-
MWC 2024丨生成式AIGC成为最大亮点—美格智能携手阿加犀推出多感知融合VSLAM解决方案
2024世界移动通信大会盛况空前,AI成为最大亮点。2月28日,美格智能携手阿加犀,将算力模组的硬件优势与AI优化部署技术相结合,在MWC展会现场展示了基于高算力AI模组的多感知融合VSLAM解决方案。这一创新性方案可应用于智能机器人与低速无人驾驶场景,助...
-
Llama.cpp工具main使用手册
Llama.cpp提供的 main工具允许你以简单有效的方式使用各种 LLaMA 语言模型。 它专门设计用于与 llama.cpp 项目配合使用。 推荐:用 NSDT编辑器 快速搭建可编程3D场景 Llama.cpp的工具 main提供简...
-
小米卢伟冰:AI是未来 但AI手机是噱头
快科技3月4日消息,最近一段时间,AI手机”成了数码圈热词,有人认为,2024年是AI手机元年”,业内许多大佬也对AI手机发表了自己的观点。 今日,小米集团总裁卢伟冰微博发文称,我在MWC的一段采访,引发了大家一直在讨论AI手机到底是未来还是噱头。由于视频...
-
【MacOS】openai 语音识别模型 whisper 本地部署教程(cpu+mps方案)
目录 1. whisper 安装 openai-whisper 参考视频链接与安装过程 安装homebrew 安装Python (不要超过3.10) 安装Pytorch 安装ffmpeg 安装rust 安装whisper 注意事项 可...
-
OpenReplay官网体验入口 AI会话回放用户行为分析工具下载地址
OpenReplay是一个自托管的会话回放和分析工具,适用于重现问题、与用户共同浏览以及优化产品。它能够捕获网络活动、控制台日志、JS错误、存储操作/状态、页面速度指标、CPU/内存使用情况等,支持Web、iOS和React Native应用。OpenRe...
-
windows安装stable-diffusion-webui教程
整合包对非技术出身的同学比较友好,因为秋叶大佬把相关的东西已经都整合好了,只需要点点点就行了。当然懂编程的同学就更没有问题了。 准备 为了保证AI绘画的效率,建议在本机安装Nvidia独立显卡,也就是俗称的N卡,并且显存要达到6G以...
-
Stable diffusion 安裝使用
GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusib UI**github:stable-diffusion-webui下載,**全程最好科學上網 1.無需下載git 可直接 Cod...
-
AI测试|Windows下跑起大模型(Llama)操作笔记
2024软件测试面试刷题,这个小程序(永久刷题),靠它快速找到工作了!(刷题APP的天花板)_软件测试刷题小程序-CSDN博客文章浏览阅读2.5k次,点赞85次,收藏11次。你知不知道有这么一个软件测试面试的刷题小程序。里面包含了面试常问的软件测试基础题,...
-
LLaMA-Factory 基于docker的大模型多卡分布式微调
LLaMA-Factory是一个相当优秀的微调工具。这里提供一个dockerfile和一个train脚本,用于多卡微调,供大家参考。 Dockerfile FROM nvidia/cuda:12.1.0-cudnn8-devel-ubuntu22.0...
-
一些安装AUTOMATIC1111的Stable Diffusion WebUI常遇到的错误消息的解决方式
确保电脑符合Stable Diffusion的系统需求 1. 电脑硬件需求 最低配备 建议配备 注解 显卡(GPU GTX1050Ti RTX3060Ti 支持的显卡芯片有Nvidia/AMD/Intel Arc/Apple M。 显...
-
AIGC下一步:如何用AI再度重构或优化媒体处理?
让媒资中“沉默的大多数”再次焕发光彩。 邹娟|演讲者 编者按 AIGC时代下,媒体内容生产领域随着AI的出现也涌现出更多的变化与挑战。面对AI的巨大冲击,如何优化或重构媒体内容生产技术架构?在多样的应用场景中媒体内容生产技术又有着怎样的实践效...
-
Stable Diffusion——见识一下正在兴起的AIGC产业!
今天再水一天,转发一篇分享文 明后天我会发布关于个人靶场搭建和内网穿透的内容,大家可以关注一下 原文地址:Stable Diffusion——见识一下正在兴起的AIGC产业! – Pleasure的博客 下面是正文部分: 前言 你或许曾在...
-
Stable Diffusion WebUI 常用命令行参数
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 本文主要讲解 Stable Diffusion WebUI 的一些常用命令行参数,内容详细的介绍了每一种参数的使用,并配有截图,非常适合初学者食用。由于时间关系,介...
-
2024年自动驾驶标注行业是否会被世界模型所颠覆?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1.数据标注面临的问题(特别是基于BEV 任务) 随着基于BEV transformer 任务的兴起,随之带来的是对数据的依赖变的越来越重,基于BEV 任务的标注也变得越来越重要。目前来看无论是2D-...
-
Stable Diffusion ComfyUI 速度更快,控制更精准
一、前言 大家在使用Stable Diffusion(简称SD)时,通常是通过网页界面进行操作的。但你们有没有听说过ComfyUI呢? ComfyUI是一个建立在节点流程上的SD操作界面。它通过流程节点来实现更细致的工作流定制以及更好的可复现性。 每...
-
Magika:基于AI支持的文件类型检测工具,依靠深度学习提供准确的检测
数字化时代,对我们所遇到的文件进行准确识别至关重要,这涉及到用户安全和信息保护的方方面面。然而,在处理众多文件格式时,如何准确迅速地检测文件内容成为一项挑战。现有方法可能并不总是高效或准确,可能导致潜在风险或误分类。 Magika作为一种创新的文件类型检测...