-
llama-cpp-python
文章目录 一、关于 llama-cpp-python 二、安装 安装配置 支持的后端 Windows 笔记 MacOS笔记 升级和重新安装 三、高级API 1、简单示例 2、从 Hugging Face Hub 中提取模型 3、聊天完成...
-
智谱AI刚刚把他们的Sora「清影」,正式开源了,我爱他们。
大半夜的,大洋对岸不卷,国内公司卷起来了。 我真的想睡觉,真的。 起因是我睡觉之前,在看Github的时候,无意间看到THUKEG这个号,更新了一个项目。 CogVideoX。 网址在此:https://github.com/THUDM/CogVideo...
-
AI日报:阿里推可控版sora;Google Gemini API大降价;小米15系列全面升级为AI系统;Remini称下载次数最多AI应用
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、媲美Perplexity!Mi...
-
OpenAI承认正研发ChatGPT文本水印:可被单独工具检测到
快科技8月5日消息,据媒体报道,OpenAI正深入探索文本水印技术的前沿领域,然而,该公司坦言,这一创新领域仍面临重重技术挑战与待解难题。 OpenAI巧妙地设想通过微妙调整ChatGPT生成文本中的词汇选择,来在字里行间编织一张不可见的数字指纹”即文本水...
-
比OpenAI的Whisper快50%,最新开源语音模型
生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa,推理效率比OpenAI开源的Whisper快50%。 aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法,允许模型在每个推理步骤中预测多个t...
-
Llama 3 图片理解能力微调(XTuner+LLaVA 版)实践笔记
基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。 环境、模型、数据准备 conda create -n llama3 python=3....
-
导出 Whisper 模型到 ONNX
前言 在语音识别领域,Whisper 模型因其出色的性能和灵活性备受关注。为了在更多平台和环境中部署 Whisper 模型,导出为 ONNX 格式是一个有效的途径。ONNX(Open Neural Network Exchange)是一个开放格式...
-
OpenAI支持的最强实体“ChatGPT机器人”,8月6日发布
Figure.AI联合创始人Brett Adcock宣布,将于8月6日(大约北京时间周二凌晨左右)发布Figure02型号。 Brett没有过多的介绍Figure02新功能和技术特性,只放出了一句狠话——这将是地球最强的人形机器人。 从Figure01...
-
AI日报:谷歌推Gemini 1.5 Pro实验版本0801;图像生成开源模型FLUX1横空出世;极速3D图像生成模型Stable Fast 3D发布;阿里语音合成模型CosyVoice更新
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、谷歌推超强多模态模型实验版Ge...
-
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
起猛了,GPT-4o被谷歌新模型超越了! 历时一周,超1,2000人匿名投票,Gemini1.5Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一) 而且这次还是双冠王,除了总榜(唯一分数上1300),在视觉排行榜上也是第一。 G...
-
贾扬清:大模型尺寸正在重走CNN的老路;马斯克:在特斯拉也是这样
Transformer大模型尺寸变化,正在重走CNN的老路! 看到大家都被LLaMA3.1吸引了注意力,贾扬清发出如此感慨。 拿大模型尺寸的发展,和CNN的发展作对比,就能发现一个明显的趋势和现象: 在ImageNet时代,研究人员和技术从业者见证了参数规...
-
文心一言 vs gpt-4 全面横向比较
文心一言是中国百度公司研发的大规模语言模型,它有超多的参数,就像一个超级大脑,特别擅长理解并生成中文内容。在聊天啊、写文章啊、答题这些任务上表现不错,对中国文化和国情有更深的理解和适应能力。 GPT-3.5是OpenAI公司的上一代大模型,比GPT-...
-
GAI工具哪家强?(ChatGPT 4 vs 文心一言)
开始之前, 先来看看 GAI和AI的区别和关系。 AI 和GAI AI 和GAI的概念 AI(Artificial Intelligence)是人工智能的缩写,是计算机科学的一个分支,旨在使机器像人类一样进行学习和思考。AI技术的研究领域包括机...
-
已向其注资近千亿!微软将OpenAI列为竞争对手
快科技8月1日消息,在微软最新提交给美国证券交易委员会(SEC)的年度报告中,将OpenAI正式列入竞争对手名单,这一名单上此前已有亚马逊、谷歌和Meta等科技巨头。 尽管微软是OpenAI的最大投资者,已向其注资约130亿美元,约合人民币939.17亿元...
-
AI日报:谷歌发布全新Gemma 2 2B模型;字节推AI音乐产品海绵音乐;Runway推Gen-3 Alpha Turbo 版本;华为Pura 70系列上线AI扩图
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、谷歌发布全新Gemma2 2B...
-
AIGC标签不会限流,创作者会相信快手的保证吗
AI生成的内容开始填充互联网世界,如今已是不可逆转的大势。在无数科技巨头的海量资源浇灌下,愈发强大的生成式人工智能(AIGC)早已开始大规模产出文字、图片、音频,乃至视频。“每天2小时,用AI批量生成文章内容,一年躺赚六位数”,类似的言论在互联网上随处可见...
-
Llama 3.1要来啦?!测试性能战胜GPT-4o
哎呀,Meta声称将于今晚发布的Llama 3.1,数小时前就在Hugging Face上泄露出来了?泄露的人很有可能是Meta员工? 还是先来看泄露出来的llama3.1吧。新的Llama 3.1模型包括8B、70B、405B三个版本。 而经...
-
OpenAI的ChatGPT-4和百度文心一言对比
目录 OpenAI的ChatGPT-4和百度文心一言对比 1.引言 2.文心一言概览 3.GPT-4概览 4.技术特点比较 4.1 模态输入 4.2 语言处理 4.3 安全性和准确性 5.应用场景比较 5.1 商业应用 5.2 教育和...
-
机器学习和AI智能写作对未来文案编辑的影响
欢迎关注小知:知孤云出岫 目录 机器学习和AI智能写作对未来文案编辑的影响 1. 简介 2. AI智能写作工具的现状 3. AI智能写作的优势 3.1 提高效率 3.2 降低成本 3.3 数据驱动的个性化 4. AI智能写作的挑战...
-
Linux系统上部署Whisper。
Whisper是一个开源的自动语音识别(ASR)模型,最初由OpenAI发布。要在本地Linux系统上部署Whisper,你可以按照以下步骤进行: 1. 创建虚拟环境 为了避免依赖冲突,建议在虚拟环境中进行部署。创建并激活一个新的虚拟环境: 如果不...
-
AI日报:GPT-4o灰测高级语音功能,ChatGPT版Her来了;Midjourney V6.1上线;360安全大模型免费开放
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、OpenAI向ChatGPT...
-
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序
探索语音转文本的未来:Faster-Whisper 及 Whisper 独立可执行程序 在人工智能领域中,语音识别技术日益成为核心组成部分,尤其是在实时翻译、字幕制作和无障碍沟通等方面。OpenAI 的 Whisper 模型以及其优化版本 Faster-...
-
终于来了,OpenAI测试GPT-4o高级语音模式!
OpenAI宣布开始向小部分ChatGPT Plus用户,测试GPT-4o的高级语音模式。 本次测试将主要搜集安全、功能方面的反馈,OpenAI会在8月初分享一份全面的GPT-4o评估报告。随后,还会发布视频和屏幕共享新功能。 获取测试权限的用户会收到O...
-
whisper-api语音识别语音翻译高性能兼容openai接口协议的开源项目
whisper-api 介绍 使用openai的开源项目winsper语音识别开源模型封装成openai chatgpt兼容接口 软件架构 使用uvicorn、fastapi、openai-whisper等开源库实现高性能接口 更多介绍 h...
-
RunDiffusion – 托管式SD绘画聚合云平台,OpenAI旗下产品, 整合所有Stable Diffusion绘画工具,不用再到处找云端了~
一、RunDiffusion是什么? RunDiffusion是一款完全托管的Stable Diffusion云端产品,全球顶尖OpenAI公司旗下产品,运行在高性能GPU上。无需编写代码,无需安装软件,无需处理错误。具备最新稳定的Diffusion版本...
-
OpenAI惨遭打脸!SearchGPT官方演示大翻车,源代码竟暴露搜索机制
【新智元导读】OpenAI再次上演了谷歌Bard出糗的一幕,SearchGPT官方震撼演示却被外媒曝出低级错误。另有神通广大的开发者甚至扒出内部源码,揭秘了背后搜索机制。网友最新一手实测,AI秒级回复让全网惊呆。 SearchGPT发布刚过两天,已有人灰度...
-
Llama 对决 GPT:AI 开源拐点已至?|智者访谈
Meta 发布 Llama3.1405B,开放权重大模型的性能表现首次与业内顶级封闭大模型比肩,AI 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文,坚定表明「开源 AI 即未来」,再次将开源与封闭的争论推向舞台中央。 回望过去,OpenAI 从开源到封...
-
音频转文字哪家强?faster-whisper还是paddlespeech,我的折腾吐槽记录
前言 作为一个魔武双修的python程序员,面对产品小姐姐提出的需求。我只能迎难而上。 目前开源的音频转文字都有哪些?效果如何?速度怎么样?带着这一连串的问题,我在github的海洋里畅游良久。接下来我把我的发现都记录如下。 1. paddles...
-
AI:208-从文本到图像-DALL-E与MidJourney的技术解读
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
OpenAI模型年化收入10亿美元,百度发布文心一言新模型、比尔·盖茨:不要“过分担心”AI 用电
ChatGPT狂飙160天,世界已经不是之前的样子。 更多资源欢迎关注 1、OpenAI AI模型销量超越微软同类产品!年化收入达10亿美元 在2019年与微软建立合作伙伴关系后,AI初创公司OpenAI显示出了惊人的销售能力,根据最新两家...
-
OpenAI要再次带国内大模型玩家飞?
被传了几个月,OpenAI终于官宣入局AI搜索。 北京时间7月26日,OpenAI在官网发布消息,宣布推出AI搜索产品SearchGPT。 OpenAI CEO山姆·奥特曼在X(前推特)公布喜讯,比起夸自己,更像是diss前人:“我们认为如今的搜索还有改...
-
项目实训:python whisper安装运行 实现语音识别技术
1.最好用python3.9以上的版本 2.安装whisper库 pip install -U openai-whisper 输入whisper查看是否安装成功 3.下载ffmpeg并添加环境变量 Releases · BtbN/FFmpeg...
-
OpenAI发布最新大模型安全对齐奖励方法——RBR
随着ChatGPT等产品的广泛应用,确保其输出的安全性成为场景化落地的关键。传统方法是使用RLHF(人类反馈强化学习)来进行安全对齐,但有两大局限性难以持续使用。 1)收集和维护人类反馈数据不仅成本高昂,并且随着大模型能力的提高以及用户行为的变化,现有的数...
-
在modelscope(魔塔)部署自己的Stable-Diffusion-WebUI并实现网络穿透,可外部调用
一、注册并登陆modelscope平台 modelscope账号的注册这里就不做过多的介绍,大家可以自行搜索完成账号注册及实名认证,领取免费GPU算力; 登陆后按下图指示依次点击选择对应配置,最后点击‘启动’开启并进入服务器...
-
硅谷AI保卫战打响!最强4050亿开源模型Llama 3.1上线,OpenAI:GPT-4o mini免费用|最新快讯
Meta CEO扎克伯格强调,美国在 AI 发展方面永远领先中国数年是不现实的。但他也指出,即使是几个月的微小领先也会随着时间的推移而“积少成多”,从而使美国获得“明显优势”。 (图片来源:Meta AI) 就在今天凌晨,Meta和OpenAI...
-
GPT-4o mini实力霸榜,限时2个月微调不花钱,每天200万训练token免费薅
Llama3.1405B巨兽开源的同时,OpenAI又抢了一波风头。从现在起,每天200万训练token免费微调模型,截止到9月23日。 Llama3.1开源的同一天,OpenAI也open了一回。 收到邮件的开发者们激动地奔走相告,这么大的羊毛一定...
-
开源语音转文本 Speech-to-Text 大模型实战之Whisper篇
前言 随着深度学习技术的不断发展,语音转文本(Speech-to-Text,STT)技术取得了显著的进步。开源社区涌现了许多高效的STT大模型,为开发者提供了强大的工具。本文将以OpenAI推出的Whisper模型为例,详细介绍如何使用该模型进行语音转文...
-
SearchGPT完全指南:OpenAI官方AI搜索功能-使用方法教程与免费使用入口
探索SearchGPT能为你带来哪些改变 为什么选择SearchGPT? SearchGPT不仅仅是一款产品——它是一项革命性的技术,致力于结合AI模型的强大能力与网络信息,为用户提供快速、及时且来源清晰的答案。致力于提供快速直接地用网络最新信息回应用户...
-
AI日报:OpenAI推搜索引擎SearchGPT;智谱推AI视频产品清影;字节发布豆包图生图模型;B站上线AIGC推荐广告标题功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、挑战谷歌!OpenAI推搜索引...
-
DeepMind AI数学奥林匹克突破银牌标准,数学推理能力再提升
谷歌旗下的DeepMind团队近期在国际数学奥林匹克(IMO)中取得了令人瞩目的成绩。DeepMind的两款人工智能模型——AlphaProof和AlphaGeometry2,成功解决了本年度比赛中的四个难题,达到了银牌水平。这一突破标志着AI在数学推理方...
-
剑指搜索巨头谷歌!OpenAI推出AI搜索引擎SearchGPT
快科技7月26日消息,OpenAI今日宣布,其AI搜索引擎SearchGPT开放内测,SearchGPT目前先向小部分用户开放,官网显示需要先申请加入候补名单。 OpenAI 表示,SearchGPT 旨在将模型的强大能力来检索网络的信息,为用户提供快速及...
-
马斯克梭哈xAI,叫板OpenAI
历时四个月,全球最大超级计算中心“Supercluster”正式开始运转。 埃隆·马斯克在社交平台公开宣布,美国时间7月22日凌晨4:20,由xAI、X和英伟达等合力打造的“Supercluster”已开始投入训练。它由10万块H100组成,是目前世界上最...
-
消息称OpenAI今年亏损或高达50亿美元
7月26日消息,据媒体报道,2024年OpenAI年亏损可能高达50亿美元。 今年6月,OpenAI CEO奥尔特曼在内部员工会议上透露,今年绝大部分收入预计来自OpenAI的产品和服务,包括ChatGPT的订阅费以及让软件开发人员通过应用程序编程接口(A...
-
一年亏损50亿美金,OpenAI不会未AGI身先死吧?
The Information 报道,据此前未公开的内部财务数据和相关人士的分析,OpenAI 预计今年亏损50亿美金,其亟需在12个月之内筹集更多现金,才能活下去。如果简单分析一下 OpenAI 的收入成本结构,你大概更能深刻理解,Sam Altman...
-
SearchGPT有哪些功能免费吗?OpenAI全新AI搜索功能怎么使用方法详细教程指南
SearchGPT 是什么? SearchGPT是OpenAI测试中的一个新AI搜索功能原型,结合了AI模型的强大能力与网络信息,为用户提供快速、及时且来源清晰的答案。 SearchGPT 有哪些功能? 快速直接地用网络最新信息回应用户问题。 提供...
-
大模型智障检测+1:Strawberry有几个r纷纷数不清,最新最强Llama3.1也傻了
继分不清9.11和9.9哪个大以后,大模型又“集体失智”了! 数不对单词“Strawberry”中有几个“r”,再次引起一片讨论。 GPT-4o不仅错了还很自信。 刚出炉的Llama-3.1405B,倒是能在验证中发现问题并改正。 比较离谱的是Clau...
-
OpenAI掀桌子!免费提供GPT-4o mini微调,每天200万tokens
OpenAI宣布从今天开始到9月23日,免费为4级、5级用户提供GPT-4o mini微调服务,帮助开发者打造特定业务用例的生成式AI应用。 在这期间,每天限制200万tokens数据,超过的部分将按照每10万tokens3美元收取。从9月24日开始,每1...
-
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
刚刚,GPT-4o mini版迎来“高光时刻”—— 登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude3.5甩在了身后。 不同于一般的数据集测评,大模型竞技场是用户自己出题、用脚投票的结果,无法通过“刷题”来走捷径,因此更为真实。 这个成绩...
-
python系列&deep_study系列:实战whisper第三天:fast whisper 语音识别服务器部署,可远程访问,可商业化部署(全部代码和详细部署步骤)
实战whisper第三天:fast whisper 语音识别服务器部署,可远程访问,可商业化部署(全部代码和详细部署步骤) 实战whisper第三天:fast whisper 语音识别服务器部署,可远程访问,可商业化部署(全部代码和详细部署步骤...
-
DeepMind CEO:AI可以发现室温超导;Llama 3.1算对9.9>9.11 | AI头条
整理 | 王启隆 出品 | AI 科技大本营(ID:rgznai100) 一分钟速览新闻点! DeepMind CEO:AI 将增强科学,如设计新药、发现室温超导、破解数学猜想 传谷歌、Meta 竞购雷朋眼镜母公司...