-
AIGC:语音克隆模型Bert-VITS2-2.3部署与实战
1 VITS2模型 1.1 摘要 单阶段文本到语音模型最近被积极研究,其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展,但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2,一种单阶段的文本到语音模型...
-
探究Python爬虫技术的发展与应用
在现代互联网技术高速发展的时代背景下,信息数据量呈几何级增长。为了更好地处理和收集这海量的数据资源,“网络爬虫”这项技术便孕育而生,并逐步成长为一种广泛应用于互联网信息采集和处理的有效手段。而在各种爬虫技术与语言当中,Python凭借着简洁高效的代码特性和...
-
走进Discuz!采集软件的奇妙世界
在众多社区和论坛解决方案中,Discus!凭借其功能齐全和较高的性价比独步舞台多年,可以算的上国内的领袖人物了。各大大小小网站在筹备自身的交互内容时经常会最先考虑的构建一个经济优惠的功能多样性质的Diucus论坛了,具有的第一个动脉不仅仅是Forr基因的L...
-
开源C++智能语音识别库whisper.cpp开发使用入门
whisper.cpp是一个C++编写的轻量级开源智能语音识别库,是基于openai的开源python智能语音模型whisper的移植版本,依赖项少,内存占用低,性能更优,方便作为依赖库集成的到应用程序中提供语音识别功能。 以下基于whisper.cpp...
-
田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型
上个月,Meta FAIR 田渊栋参与的一项研究广受好评,他们在论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10...
-
神经网络之父Hinton最新公开演讲:数字智能会取代生物智能吗?
Geoffrey Hinton教授,人称“人工智能教父”,他是英国皇家学会院士(FRS ,也是加拿大皇家学会院士( FRSC 和加拿大国家勋章(CC 获得者。 牛津大学于2024年2月19日在谢尔顿剧院举办了年度Romanes讲座,Geoffrey Hi...
-
使用科大讯飞api以及文心一言模型实现对话
因为比赛要用到人机进行对话所以写以下python代码。以下为3.8 代码中相关api以及密匙都更改过,请自己去获得密匙 科大讯飞网址讯飞开放平台-以语音交互为核心的人工智能开放平台 (xfyun.cn 百度千帆文心一言百度智能云千帆大模型 (bai...
-
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练。 值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。 论文地址:https://arxiv.org/abs/2402.1681...
-
【AI】Chinese-LLaMA-Alpaca-2 1.3B 7B 13B llama.cpp 量化方法选择及推理结果测试 x86_64 RTX 2060 6G 生成程序源码测试
1.3B Q4_0 (很快,没用 llm_load_print_meta: model type = ?B llm_load_print_meta: model ftype = Q4_0 llm_load_print_meta:...
-
whisper.cpp安装配置
下载代码,代码地址:https://github.com/ggerganov/whisper.cpp 下载模型,现有模型如下,small 模型基本能达到日常的用途,建议下载 small 以上的。下载模型的指令: ./download-ggml-mode...
-
AIGC ChatGPT4完成业务需求SQL学习
源表如下: 例如现在需要显示每个岗位中工资排名前10位的员工信息,并显示排名应该要怎么做呢? Prompt: 有一个某公司职员表,表名为Bank_emp,empno为员工编号,ename为员工姓名,JOB为员工岗位,sal为工资,dept为部门,...
-
生成式AI智能体之间的秘密串通:一场隐藏的危机,你准备好了吗?
大型语言模型(LLM)的能力增强,开辟了一组通信生成AI智能体解决联合任务的应用程序。这对未经授权的信息共享或其他不必要的智能体协调形式带来了隐私和安全挑战。现代隐写技术可能会使这种动态难以检测。通过借鉴人工智能和安全文献中的相关概念,全面正式化了生成人...
-
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraf...
-
训不动Mixtral,要不试试LLaMA-MoE?
深度学习自然语言处理 原创作者:cola 随着各种各样增强版LLaMA的出现,Mixture-of-Expert(MoE 类模型越来越受大家关注。而LLaMA-MoE正是基于LLaMA系列和SlimPajama的MoE模型。它显著的一个好处...
-
基于LLaVA开源模型打造视频聊天助手
简介 大型语言模型已经证明自己是一项革命性的技术。目前,人们已经开发出了许多基于大型语言模型功能的应用程序,而且预计很快还会有更多的应用程序问世。大型语言模型最有趣的应用之一是将其部署为智能助手,它们能够帮助人类用户完成各种任务。 人们已经能够通过指令微...
-
AI视频年大爆发!Gen-2/Pika成时代爆款,2023年AI视频生成领域的现状全盘点
【新智元导读】2023年,也是AI视频元年。过去一年究竟有哪些爆款应用诞生,未来视频生成领域面临的难题还有哪些? 过去一年,AI视频领域我们见证了,Gen-2、Pika等爆款产品的诞生。 来自a16z的Justine Moore,详细盘点了人工智能视频生成...
-
文心一言插件开发(第三篇
目录 1. 从0到1开发自己的插件: 1.1 插件描述文件(ai-plugin.json) 1.2 服务描述文件(openapi.yaml) 1.2.1 数据类型: 1.2.1 OpenAPI 对象: 1.3 示例描述文件(example...
-
详解各种LLM系列|LLaMA 1 模型架构、预训练、部署优化特点总结
作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/668698204 后台留言『交流』,加入 NewBee讨论组 LLaMA 是Meta在2...
-
Llama-7b-hf和vicuna-7b-delta-v0合并成vicuna-7b-v0
最近使用pandagpt需要vicuna-7b-v0,重新过了一遍,前段时间部署了vicuna-7b-v3,还是有不少差别的,transforms和fastchat版本更新导致许多地方不匹配,出现很多错误,记录一下。 更多相关内容可见Fastchat实战...
-
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必...
-
OpenAI组建儿童安全团队 防止AI工具被误用
在家长和活动人士的监督下,知名人工智能公司OpenAI近期组建了一个新的儿童安全团队,研究防止其AI工具被未成年人误用或滥用的方法。 根据OpenAI职业页面的新招聘信息,该团队将与公司内部的政策、法律和调查小组以及外部合作伙伴合作,管理与未成年用户相关的...
-
【AIGC】prompt工程从入门到精通
注:本文示例默认“文心大模型3.5”演示,表示为>或w>(wenxin ,有时为了对比也用百川2.0展示b>(baichuan 有时候为了模拟错误输出,会用到m>(mock 表示(因为用的大模型都会给出正确答案) 有时候直接贴网络...
-
7B开源数学模型干翻千亿GPT-4,中国团队出品
7B开源模型,数学能力超过了千亿规模的GPT-4! 它的表现可谓是突破了开源模型的极限,连阿里通义的研究员也感叹缩放定律是不是失效了。 无需借助任何外部工具,它就能在竞赛水平的MATH数据集上达到51.7%的准确率。 在开源模型中,它第一个在该数据集上...
-
在2GB DAYU200上本地部署大语言模型
实现思路和步骤 移植轻量级LLM模型推理框架InferLLM到OpenHarmony标准系统,编译出能在OpenHarmony运行的二进制产物。(InferLLM 是一个简单高效的 LLM CPU 推理框架,可以本地部署 LLM 中的量化模型) 使用O...
-
【AIGC】猴子拍照版权是谁的:一文读懂AIGC和版权问题
目录 一、没有明确的定义 1.AI画作算作品吗? 2.AI 绘画的版权归谁? 二、关注平台的版权声明 三、猴子拍照 1、是否应当给予AI作品版权? 2、AI创作的版权赋予谁? 写文章,做图片,AI无所不能,虽然有时也冒点傻气,但是确实...
-
两亿参数时序模型替代LLM?谷歌突破性研究被批「犯新手错误」
最近,谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。 这篇论文的标题是「A decoder-only foundation model for time-series forecasting(用于时间序列预测的仅解码器基础模型)」。 简而言之,...
-
大模型真能解决一切吗?关于知识驱动自动驾驶的一些思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 上个星期受邀在外面做了一次关于「知识驱动自动驾驶」的讲座,刚好借这个机会把之前我和团队的一些学术上的思考整理凝练了一下。感觉里面一些内容还是挺值得拿出来分享&讨论的,所以开这么个帖子把其中一些关...
-
NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]
国内外大模型汇总列表 中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。 Awesome family related to LLMS includes: https://github.com/wgwang...
-
史上首个100%开源大模型重磅登场!破纪录公开代码/权重/数据集/训练全过程,AMD都能训
多年来,语言模型一直是自然语言处理(NLP)技术的核心,考虑到模型背后的巨大商业价值,最大最先进的模型的技术细节都是不公开的。 现在,真·完全开源的大模型来了! 来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员,联合发表了...
-
【书籍】强化学习第二版(英文版电子版下载、github源码)-附copilot翻译的中英文目录...
Python代码:https://github.com/ShangtongZhang/reinforcement-learning-an-introduction 英文原版书籍下载:http://incompleteideas.net/bo...
-
.Net接入AzureOpenAI、OpenAI、通义千问、智谱AI、讯飞星火、文心一言大语言模型。
前言 现在在网上搜索.NET接入大模型的帖子很少,有些官方案例只提供java和python的SDK,所以有了这篇.Net的接入大模型文章,目前仅实现对话模型的调用。 这里仅举例通义千问,其他模型实现可以参考Gi他Hub 对您有帮助的话帮忙点个star...
-
【AI】aarch64 kylin llama.cpp CUDA 适配 Chinese-LLaMA-Alpaca-2 启用 Tesla P4 8G GPU支持【失败】
GPU GPU架构信息 Pascal架构: compute_60: GeForce GTX 10xx系列、TITAN Xp, Tesla P100等 compute_61: Quadro GP100, Tesla P40等 co...
-
OpenAI“复制粘贴”背后:剽窃者想要免费获得一切
如今,人们发表的文章或作品被剽窃,而剽窃者免费使用或为此获利的事例屡见不鲜。从互联网到AI,莫不如此。 比如,如今火热的OpenAI,其AI模型就很少为其使用的内容付费,该公司在2023年创造了13亿美元的收入。 OpenAI的狡辩 在《纽约时报》针对...
-
OpenAI启动一个帮助青少年安全地使用人工智能的项目
OpenAI在周一宣布,它将与Common Sense Media合作,启动一个旨在帮助青少年安全地使用人工智能的项目。 “我们想要找出如何让这个工具安全、负责、广泛地提供给青少年和那些将要把它作为教育经历的一部分的人,”OpenAI的首席执行官Sam...
-
Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效
随着 LLaMA、Mistral 等大语言模型的成功,各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂,且新旧模型之间可能存在能力的冗余。 近日,中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM,用...
-
高效底座模型LLaMA
论文标题:LLaMA: Open and Efficient Foundation Language Models 论文链接:https://arxiv.org/abs/2302.13971 论文来源:Meta AI 一、概述 大型语...
-
使用 Transformers 为多语种语音识别任务微调 Whisper 模型
本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时,我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识,并提供...
-
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据...
-
NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜
近日,作为美国前十的科技博客,Latent Space对于刚刚过去的NeurIPS 2023大会进行了精选回顾总结。 在NeurIPS会议总共接受的3586篇论文之中,除去6篇获奖论文,其他论文也同样优秀和具有潜力,甚至有可能预示着下一个AI领域的新突破...
-
stable diffusion在server上的部署测试
SD infinite canvas Automatic1111 vs InvokeAI Automatic1111 vs InvokeAI - pros and cons stablediffusion-infinity 该repo的问题是已...
-
Stable Diffusion 硬核生存指南:WebUI 中的 VAE
本文使用「署名 4.0 国际 (CC BY 4.0 」许可协议,欢迎转载、或重新修改使用,但需要注明来源。 署名 4.0 国际 (CC BY 4.0 本文作者: 苏洋 创建时间: 2023年07月30日 统计字数: 11485字 阅读时间: 23分钟...
-
AI对比:ChatGPT和文心一言的区别和差异
目录 一、ChatGPT和文心一言大模型的对比分析 1.1 二者训练的数据情况分析 1.2 训练大模型数据规模和参数对比 1.3 二者3.5版本大模型对比总结 二、ChatGPT和文心一言功能对比分析 2.1 二者产品提供的功能情况分析...
-
stable diffusion模型训练时数据量
文生图模型之Stable Diffusion - 知乎通向AGI之路码字真心不易,求点赞! https://zhuanlan.zhihu.com/p/6424968622022年可谓是 AIGC(AI Generated Content)元年,上半年有文生...
-
AI对决:文心一言 VS ChatGPT 全方面比拼
目录 背景 对比环节 文章生成 GhatGPT: 文心一言: 故事编写 ChatGPT: 文心一言: 代码生成 ChatGPT: 文心一言: 技术教学 ChatGPT: 文心一言: 评价环节 背景 ...
-
[NLP]LLaMA与LLamMA2解读
摘要 Meta最近提出了LLaMA(开放和高效的基础语言模型 模型参数包括从7B到65B等多个版本。最值得注意的是,LLaMA-13B的性能优于GPT-3,而体积却小了10倍以上,LLaMA-65B与Chinchilla-70B和PaLM-540B具有竞...
-
用uniapp跨平台开发一款商用的ai绘图ai作画软件的全过程
随着科技的发展,人工智能将会是以后的主流方向,ai绘图、chatgpt高科技先后出台,都获得了火爆的发展,因此想借着势头开发一款主打ai绘图的app+小程序 一、前期准备 1、选定技术框架 因为后面需要多平台发布,而尽可能减少开发成本,因此选定了...
-
我用 midjourney 创作的那些好看的图片
下面这些是个人的midjourney v5的关键词,各种类型都有 抽象画 One piece of original artwork from 1998 , in the style of confucian ideology, pop art-in...
-
Java调用Midjourney进行AI画图原生版抓包实现支持中文
用途介绍 Midjourney是一个目前优秀的AI画图工具,不挂梯无法直接访问 本代码主要用于搭建镜像站使用 适合人群 本代码不适合新手,建议使用过okhttp、且具有二开能力的同学使用~ 实现原理 通过调用发送信息接口发送请求,通过轮询房间消...
-
20源代码模型的数据增强方法:克隆检测、缺陷检测和修复、代码摘要、代码搜索、代码补全、代码翻译、代码问答、问题分类、方法名称预测和类型预测对论文进行分组【网安AIGC专题11.15】
Data Augmentation Approaches for Source Code Models: A Survey 写在最前面 对nlp领域其他方向的启发 英文版: 论文名片 论文总结 一个有意思的表 1.背景Background...
-
使用 Transformers 为多语种语音识别任务微调 Whisper 模型
本文提供了一个使用 Hugging Face ? Transformers 在任意多语种语音识别 (ASR 数据集上微调 Whisper 的分步指南。同时,我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识,...