-
AI神器腾讯元宝APP上线 基于腾讯混元大模型开发打造
站长之家(ChinaZ.com)5月30日 消息:今日,基于腾讯混元大模型开发的AI产品——“腾讯元宝”正式上线。这款App与先前的混元小程序版本相比,更加聚焦于AI技术的深度应用,为用户提供了包括AI搜索、AI总结、AI写作在内的核心功能,展现了其全面的...
-
Spring Boot3.x与阿里云人脸识别服务对接实现人脸识别
本专题致力于深入探讨如何通过SpringBoot3.x框架与OpenCV库实现高效的人脸检测和人脸识别系统。通过系统化的10篇文章,从基础概念到高级应用,结合代码示例和实战案例,逐步引导大家掌握从零开始构建完整人脸检测与识别系统的全过程。 阿里云人脸识别...
-
“采集吧”探秘:数据时代的宝藏之地
随着互联网的繁荣发展,数据信息已逐渐渗透到我们生活的方方面面。在这个大数据的时代,如何高效地收集、整合与利用信息,成为了许多行业和个人需要面对的重要课题。“采集吧”应运而生,它不仅是一个强大的数据采集平台,更是一个充满无限可能的宝藏之地。本文将深入剖析“采...
-
OpenAI与普华永道合作,为10万员工提供ChatGPT
5月30日,全球四大会计事务所之一的普华永道(PwC)在官网宣布,与OpenAI达成技术、市场双向合作,成为其最大客户和首家产品经销商。 根据协议,普华永道将向其美国75,000名和英国的26,000名员工提供ChatGPT Enterprise(企业版)...
-
卷爆短剧出海:五大关键,由AIGC重构
短剧高温下,谈谈AIGC的助攻路线。 短剧,一个席卷全球的高温赛道。 以往只是踏着霸总题材,如今,内容循着精品化、IP化的自然发展风向,给内容、制作、平台等产业全链都带来新机,也让短剧消费走向文化深处,触发更大的社会渲染力。 从国内到全球,短剧行...
-
AI绘画,Midjourney API 接口对接和使用
项目背景 众所周知,Midjourney并没有提供任何的Api服务,但是基于Midjourney目前的行业龙头位置,很多企业以及个人会有相关的需求。TTApi平台基于Midjourney现有功能整理出一套完整的可集成性高的服务,如果你有类似的需求,那么...
-
Springboot整合文心一言----非流式响应与流式响应(前后端)
所谓非流式响应就是直接等待百度把答案生成好之后直接返回给你,而后者这是一一种流的形式,百度一边生成答案,一边将答案进行返回,这样就是我们在使用ChatGPT中最常见的一种表现了,它回答问题的时候总是一个字一个字的出来。这两回答方式都有一定的...
-
Midjourney该怎么用?从零基础到落地实践
前言 从注册登录到基本的操作界面,提示词组成后缀介绍,到主流的生成图片的方式,以及最重要的提示词咒语分享,还有一些我的使用心得,希望对大家有帮助! 喜欢的话欢迎关注我,欢迎点赞收藏评论!~ 一、AI绘画的背景 1.1 AI绘画的发展 最...
-
私域运营系统爬虫:构建智能化运营新生态
在当今数字化时代,私域流量运营已成为企业营销战略的重要组成部分。为了更有效地挖掘和利用私域流量,越来越多的企业开始借助“私域运营系统爬虫”技术,以提升运营效率和用户黏性。本文将深入探讨私域运营系统爬虫的概念、应用场景、优势挑战以及未来发展趋势,帮助企业更好...
-
Meta Llama 3本地部署
感谢阅读 环境安装 收尾 环境安装 项目文件 下载完后在根目录进入命令终端(windows下cmd、linux下终端、conda的话activate) 运行 pip install -e . 不要控制台,因为还要下载模型。这...
-
商汤日日新大模型5.0粤语版发布 定价30港元1M tokens
商汤科技正式发布了全新的“日日新大模型5.0粤语版”。这一版本不仅定价亲民,以30港元的价格提供1M tokens(输入与输出均同价)的优质服务,而且支持最大128K窗口,确保用户在使用过程中获得流畅、高效的体验。 此外,“商量粤语版”还将推出网页版和Ap...
-
苹果青睐独立开发者:ChatGPT无缘年度设计奖入围名单
近日,苹果公司公布了其年度设计奖的入围名单,明确表彰独立应用程序和初创公司,而非大型科技公司,包括那些提供人工智能聊天机器人的公司。在当前AppStore模式受到立法者和监管机构质疑之际,苹果将目光投向了那些在其平台上表现突出的中小型应用程序制造商。 在今...
-
一文带你了解大模型:智能体(Agent)
作者 | lucasgftang 大语言模型 vs 人类 大语言模型很强大,就像人类的大脑一样拥有思考的能力。如果人类只有大脑,没有四肢,没有工具,是没办法与世界互动的。如果我们能给大模型配备上四肢和工具呢?大模型是不是就会打破次元壁,从数字世界走向现实...
-
Python+whisper.cpp纯本地化语音转文字
想要用Python+whisper.cpp实现纯本地化语音转文字,我的操作环境如下: MacOS Ventura 13.0 Python3.7 conda PyAudio 一开始打算用PyAudio,解决了头文件找不到的问题(网上教程很多)之后,仍...
-
采集用户名:探讨其重要性、方法与伦理准则
在数字时代的浩瀚海洋中,数据被誉为“新时代的石油”,而“用户名”则是这片海洋中不可或缺的一部分。无论是互联网企业、电商平台还是社交媒体,用户名的采集都显得至关重要。本文将探讨采集用户名的重要性、常见方法以及应遵循的伦理准则。一、采集用户名的重要性用户名作为...
-
Stable Diffusion从入门到卸载,一站式服务为你的AI绘画保驾护航!
大家好,目前正在学习研究Stable Diffusion,致力于用最为朴素直白的语言为你介绍AI绘画的相关知识。 花了很长的时间,终于整理好这份Stable Diffusion的教程,从入门的安装、本地部署到觉得疲惫,安装失败,想要卸载,里面的内容应有尽...
-
【AIGC】Mac Intel 本地 LLM 部署经验汇总(CPU Only)
书接上文,在《【AIGC】本地部署 ollama(gguf 与项目整合》章节的最后,我在 ollama 中部署 qwen1_5-14b-chat-q4_k_m.gguf 预量化模型,在非 Stream 模式下需要 89 秒才完成一轮问答,响应速度实在是太...
-
使用文心一言进行图像内容理解
接上篇文章,这期使用文心一言图像识别API,对本地图片以及在线视频图片进行内容理解。 该请求用于图像内容理解,支持输入图片和提问信息,可对输入图片进行理解,输出对图片的一句话描述,同时可针对图片内的主体/文字等进行检测与识别,支持返回图片内多主体/文字的...
-
【Stable Diffusion】Roop换脸插件,全网最简单傻瓜式安装教程
今天也是应粉丝的要求,出一篇关于roop插件安装的教程。之前已经写过两篇关于roop插件的使用文章,它确实是目前最方便快捷的一款换脸插件了。 无需Lora,一键换脸插件Roop(点击下方图片跳转) 多人物脸部替换,一键换脸插件Roop(2)(点击下方图...
-
实战whisper语音识别第一天,部署服务器,可远程访问,实时语音转文字(全部代码和详细部署步骤)
Whisper是OpenAI于2022年发布的一个开源深度学习模型,专门用于语音识别任务。它能够将音频转换成文字,支持多种语言的识别,包括但不限于英语、中文、西班牙语等。Whisper模型的特点是它在多种不同的音频条件下(如不同的背景噪声水平、说话者的口音...
-
苹果豪赌!神秘AI项目曝光,宁死不用英伟达?自研芯片全家桶都要AI了
最近一轮AI之战,OpenAI、谷歌、微软都交卷了,现在,全世界的目光齐刷刷看向苹果。 全球开发者大会,就在6月上旬。选择这个时机发布新产品,苹果勇气可嘉。 被一众竞品抢尽风头后,苹果得拿出什么重大突破来,才能证明自己在AI领域还能让人兴奋? 看起来,苹...
-
CIO指南:采用开源生成式AI需要注意的十件事
开源生成式AI模型是可以免费下载的、大规模使用而无需增加API调用成本的,并且可以在企业防火墙后面安全运行。但你不要放松警惕,风险仍然存在,有些风险不仅被放大了,而且针对生成式AI的新风险正在出现。 如今似乎任何人都可以制作AI模型,即使你没有训练数...
-
Midjourney和stable diffusion到底有什么区别?要怎么选?
前言 目前AIGC领域里最强的两款软件,Midjourney(MJ)和stable diffusion(SD)到底有什么区别?我们应该怎么选择呢?这是很多新手朋友经常问的问题,这篇文章对此问题专门进行解释说明。 在aigc界的地位 MJ和SD在a...
-
本地部署GPT MJ: chatgpt-web-midjourney-proxy本地部署指南
1.准备工作 本文通过docker或桌面应用程序部署,包括chatgpt和MJ绘图webui。可以部署在本地电脑,也可以部署在云服务器,方便随时远程访问。 准备调用API所需的KEY。 1.1 点击链接进入官网,直接点击右上角...
-
“蓝天采集发布”:新时代下的环境保护与信息传播
在当今社会,环境保护已经成为人们共同关注的焦点。随着科技的不断发展,信息传播方式也日新月异。蓝天采集发布作为一种新型的环境信息传播方式,正逐渐走进人们的视野,为环境保护事业注入新的活力。本文将深入探讨蓝天采集发布的内涵、意义以及实际应用,以期为新时代下的环...
-
利用SpringBoot和TensorFlow进行语音识别模型训练与应用
本专题系统讲解了如何利用SpringBoot集成音频识别技术,涵盖了从基础配置到复杂应用的方方面面。通过本文,读者可以了解到在智能语音填单、智能语音交互、智能语音检索等场景中,音频识别技术如何有效提升人机交互效率。无论是本地存储检索,还是云服务的集成,丰...
-
Midjourney是什么?Midjourney怎么用?怎么注册Midjourney账号?国内怎么使用Midjourney?多人合租Midjourney拼车
Midjourney是什么 OpenAI发布的ChatGPT4引领了聊天机器人的竞争浪潮,随后谷歌推出了自己的AI聊天机器人Bard,紧接着微软推出了Bing Chat,百度也推出了文心一言,这些聊天机器人的推出,标志着对话式AI技术已经达到了一个新的...
-
机器学习:K均值算法
一、基础理论 1. 欧氏距离 想象你在北京,想要知道离上海有多远,则可以直接计算这个城市(两点)间直线的距离,这就是欧氏距离。 在二维平面上,在二维平面上有两个点A(x1, y1 和B(x2, y2 ,欧氏距离为: 图片 欧氏距离衡量的是两点间的真实物理...
-
midjourney-proxy-plus搭建教程
目录 0.演示环境 1.创建Midjourney网页 2.搭建mj代理地址 3.创建目录文件 4.同步和开放数据库端口 5.拉取镜像 6.创建容器 0.演示环境 CentOS 8 宝塔8.0 Nginx >= 1.19....
-
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体
当前,多模态大模型 (MLLM)在多项视觉任务上展现出了强大的认知理解能力。 然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。 比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。 定位能力的缺失直接限制了多模态...
-
Spring AI项目Open AI绘画开发指导
Spring AI项目创建 Spring AI简介 创建Spring AI项目 配置项目pom和application文件 controller接口开发 运行测试 Spring AI简介 Spring AI 是 AI 工程的应用...
-
LLaMA-Factory微调LLama2
LLaMA-Factory(0.6.2版本 微调LLama2 1.下载安装 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e...
-
百度文心一言(ERNIE bot)API接入Android应用
百度文心一言(ERNIE bot)API接入Android应用实践 - 拾一贰叁 - 博客园 (cnblogs.com 需要完整代码的话:https://gitee.com/liyizhe2002/we-are-speakers Preface:...
-
人工智能辅导应用在美国学生中炙手可热 多款来自中国AI厂商开发
美国学生正热衷于使用基于人工智能的家庭作业应用进行课后辅导。这些应用利用大型语言模型如ChatGPT为学生提供个性化、按需的学习帮助,从解答数学题到写作论文无所不包。 休斯顿高中生埃文就是其中一例。他曾请私人家教辅导,时薪高达60美元。现在他改用名为Ans...
-
2024年大数据最全AI绘画普及课【二】文生图入门_平铺 分块 (tiling)(3),2024年最新稳进大厂
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。 需要这份系统化资料的朋友,可以戳这里获取 一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的...
-
llama-factory SFT系列教程 (二),大模型在自定义数据集 lora 训练与部署
文章目录 简介 支持的模型列表 2. 添加自定义数据集 3. lora 微调 4. 大模型 + lora 权重,部署 问题 参考资料 简介 文章列表: llama-factory SFT系列教程 (一 ,大模型 API 部署与...
-
Llama 3大模型发布!快速体验推理及微调
Meta,一家全球知名的科技和社交媒体巨头,在其官方网站上正式宣布了一款开源的大型预训练语言模型——Llama-3。 据了解,Llama-3模型提供了两种不同参数规模的版本,分别是80亿参数和700亿参数。这两种版本分别针...
-
llama-factory SFT系列教程 (一),大模型 API 部署与使用
文章目录 背景 简介 难点 前置条件 1. 大模型 api 部署 下一步阅读 背景 本来今天没有计划学 llama-factory,逐步跟着github的文档走,发现这框架确实挺方便,逐渐掌握了一些。 最近想使用 SFT 微调大模...
-
AIGC,ChatGPT总结Excel中最强查找函数XLOOKUP用法
众所周知经常使用表格的人都知道,最新查找函数XLOOKUP将替代VLOOKUP函数,成为Excel中最强的查找函数。 今天我们就来总结一下XLOOKUP函数的具用法。 首先我们先使用AIGC ,ChatGPT来介绍一下XLOOKUP函数的功能与作用。...
-
ai写作神器哪个好用?九款AI写作软件助你突破创作瓶颈
当灵感的火花在脑海中闪烁,我们总是迫不及待地想要将它们转化为文字。 然而,在创作的过程中,我们时常会遇到各种挑战,如词汇量不足、思路不畅等。此时,AI写作软件便成为了我们的得力助手,它们凭借智能分析和预测能力,为我们提供了丰富的创意和灵感。 接下来,我...
-
【AIGC】本地部署 ollama + open-webui
在之前的篇章《【AIGC】本地部署 ollama(gguf 与项目整合》中我们已经使用 ollama 部署了一个基于预量化(gguf)的 Qwen1.5 模型,这个模型除了提供研发使用外,我还想提供给公司内部使用,因此还需要一个 ui 交互界面。 显然...
-
FastGPT 调用本地Whisper模型进行语音转文字
目录 一、部署Whisper模型。 二、oneapi配置 三、修改镜像中的webservice.py文件,开放跨域请求。 四、修改FastGPT代码修改 FastGPT地址:https://github.com/labring/FastGP...
-
使用Flask实现:基于midjourney-proxy的MJ绘画实现(开源)
文章目录 实现效果 实现步骤 完整源码 实现效果 运行mj.py,如下所示。输入中文,自动生成提示词,自动开始下载。用户选择是否需要变换图片,选择需要对哪个图片变换,自动保存。 之前想做一个网页版,只实现了demo效果不好看,就不...
-
llama-factory/peft微调千问1.5-7b-chat
目标 使用COIG-CQIA数据集和通用sft数据集对qwen1.5-7b-chat进行sft微调,使用公开dpo数据集进行dpo对齐。学习千问的长度外推方法。 一、训练配置 使用Lora方式, 将lora改为full即可使用全量微调。具体的参数...
-
Llama 3开源!手把手带你推理,部署,微调
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 汇总合集 《大模型面试...
-
[AIGC ]详解MinIO:特性,Docker部署和Spring Boot集成
MinIO是一个基于Apache License v2.0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口,非常适合存储大容量非结构化的数据,如图片、视频、日志文件、备份数据、容器/虚机镜像等,而且MinIO非常轻量,只有一个单独的二进制文件。它的设...
-
AIGC时代重塑数字安全风控体系
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
Llama-Factory + Ollama 打造属于自己的中文版 Llama3
Meta 推出 Llama3 也有一小段时间了。Llama3 包含 8B 和 70B 两种参数规模,涵盖预训练和指令调优的变体。Llama 3 支持多种商业和研究用途,并已在多个行业标准测试中展示了其卓越的性能(关于Llama3的具体介绍可以参考本站另外一...
-
实战whisper第二天:直播语音转字幕(全部代码和详细部署步骤)
直播语音实时转字幕: 基于Whisper的实时直播语音转录或翻译是一项使用OpenAI的Whisper模型实现的技术,它能够实时将直播中的语音内容转录成文本,甚至翻译成另一种语言。这一过程大致分为三个步骤:捕获直播音频流、语音识别(转录)以及翻译(如...
-
生成式 AI 在电商领域究竟有多牛,这款产品给出了回答
Photoroom 是电商图片行业的先行者,来源于对背景擦除这个单点功能的探索,Photoroom 在 Gen AI 前的时代找到了自己的PMF。在浪潮来临时,凭借着用户理解和产品载体的迭代,Photoroom 在商业图片制作领域的可用性更强了。目前,Ph...