-
乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜
OpenAI 的宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届 DevDay 开发者大会。 不过,与去年盛大的活动相比,今年略显低调,他们没有推出重大产品,而是选择对其现有的 AI 工具和 API 进行增量改进。 在这次活动中,OpenAI 发布了四大...
-
本地搭建 Whisper 语音识别模型
Whisper 是由 OpenAI 开发的一款强大的语音识别模型,具有出色的多语言处理能力。搭建和使用 Whisper 模型可以帮助您将音频内容转换为文本,这在语音转写、语音助手、字幕生成等应用中都具有广泛的用途。本指南将对如何在本地环境中搭建 Whisp...
-
AI智能体是什么?AI智能体工程师前景如何?
在人工智能飞速发展的今天,AI智能体(AI Agent)逐渐走进了公众视野。对于AI领域的初学者来说,理解AI智能体的概念、组成和应用场景是入门的关键。码叔今天为你揭开AI智能体AI Agent的神秘面纱,带你一探究竟。 AI智能体的能力与大模型紧密相连...
-
Whisper.net 使用教程
Whisper.net 使用教程 whisper.netWhisper.net. Speech to text made simple using Whisper Models项目地址:https://gitcode.com/gh_mirrors/wh...
-
OpenAI神秘模型「草莓」两周内上线?数学推理暴涨,月收费200刀已有人付费
就在刚刚,The Information曝出:OpenAI的草莓将于两周内上线!收费疑似200刀一个月,最大的特色就是比其他模型多思考10到20秒。然而因为「狼来了」太多回,网友们忍不住吐槽:OpenAI现在就是个炒作公司。 最新消息,「草莓」将在两周内发...
-
真正的AI电视来了!Vidda X 2025和X Mini引领客厅智能新方向
9月9日,海信旗下年轻科技潮牌Vidda正式发布新一代Mini LED AI电视,新品包含X2025和X Mini两大系列。根据发布会上Vidda大屏显示负责人的介绍,Vidda AI电视不仅带来极具智价比的高配硬件,加速推动了Mini LED显示技术的普...
-
如何加入理想汽车内测:AI理想同学首次公开解答
快科技9月9日消息,理想汽车最近推出了AI理想同学,这是一项基于Mind GPT大模型优化的人工智能服务。 旨在解答用户在用车、出行、娱乐和百科等方面的问题,甚至能够以适合儿童的语言进行交流。 在第一期的热门问题回答中,AI理想同学特别针对如何加入理想汽...
-
如何本地搭建Whisper语音识别模型
如何本地搭建Whisper语音识别模型 如何本地搭建Whisper语音识别模型 1. 引言 Whisper模型简介 本地搭建的意义和应用场景 应用场景包括但不限于: 2. 环境准备 系统要求 Python环境安装 依赖库安装 3. 安...
-
探索音频转文字的高效之道:whisper-rs项目解析与应用
探索音频转文字的高效之道:whisper-rs项目解析与应用 whisper-rsRust bindings to https://github.com/ggerganov/whisper.cpp项目地址:https://gitcode.com/gh_...
-
小爱大模型来了!9款无屏小爱音箱推送新系统:免费用
快科技8月23日消息,上个月,小米宣布小爱大模型将迎来全量升级,全部免费。 据悉,小爱升级大模型之后会更聪明,比如支持智能问答功能,并能够根据用户要求创作等等,甚至闲聊的体验都能大幅升级。 根据官方公布的时间表,7月底是手机、平板、电视等升级,而8月底无屏...
-
Whisper Burn 开源项目教程
Whisper Burn 开源项目教程 whisper-burnA Rust implementation of OpenAI's Whisper model using the burn framework项目地址:https://gitcode.c...
-
Fish Speech: 开源文本转语音技术(TTS)的新里程碑
简介 Fish Speech 是一个全新的文本转语音(TTS 解决方案,该项目由fishaudio开发。当前模型使用约十五万小时三语数据训练,对中文支持非常的完美。 能够熟练处理和生成中文、日语和英语的语音,语言处理能力接近人类水平,并且声音表现形式丰...
-
LLaMA.cpp 是什么?与 GPT 哪个效果更好?
LLaMA.cpp 概述 LLaMA.cpp 是 Facebook LLaMA 模型的 C/C++ 端口,LLaMA 模型是一种大型语言模型 (LLM ,可以生成文本、翻译语言、编写不同类型的创意内容,并以信息丰富的方式回答您的问题。它仍在开发中,但它...
-
转嫁成本给用户!苹果AI可能要收费:每月超140元
快科技8月8日消息,据媒体报道,苹果正考虑为其即将推出人工智能系统Apple Intelligence向用户收费,预计每月价格高达20美元(约合143元人民币)。 Counterpoint Research的合伙人Neil Shah透露,苹果计划在年内晚些...
-
麦当劳决定炒掉AI员工,用AI点餐这件事不靠谱
从游戏公司的画师到电销公司的客服,被AI影响到工作的人在2023年可谓是一茬接着一茬,甚至“第一批因AI而失业的人出现”更是成为了去年部分媒体最有兴趣的话题。事实上,AI技术的快速发展确实已经开始对人类社会造成影响,但过高估计当下AI的能力也大可不必,因为...
-
快速上手文心一言指令:解锁智能对话的新纪元(续1)
这是老K的第7篇原创 导语: 不管人们愿意不愿意,人工智能已经渗透到我们生活的方方面面,从简单的语音助手到复杂的自然语言处理系统,AI正以前所未有的速度改变着我们的交流方式。作为百度倾力打造的智能对话产品,文心一言不仅集成了先进的自然...
-
构建您的私人语音助手:在本地运行的Whisper + Ollama + Bark之旅
构建您的私人语音助手:在本地运行的Whisper + Ollama + Bark之旅 在深入了解如何构建并本地运行自己的大型语言模型(RAG)后,今天我们将更进一步,不仅实现高级对话功能,还赋予其听和说的能力。想象一下拥有如电影《钢铁侠》中Jarvis或...
-
奥迪微软强强联手:约200万辆汽车即将接入ChatGPT
快科技6月28日消息,据媒体报道,奥迪近期宣布与微软Azure OpenAI服务合作,计划从今年7月起为约200万辆汽车接入ChatGPT技术,以提升车辆的语音控制功能。 自2021年起生产的配备第三代模块化信息娱乐系统(MIB 3)的奥迪车型将通过Cha...
-
聚观早报 | 百度文心一言上线新功能;腾势Z9GT将发布
聚观早报每日整理最值得关注的行业重点事件,帮助大家及时了解最新行业动态,每日读报,就读聚观365资讯简报。 整理丨Cutie 4月08日消息 百度文心一言上线新功能 腾势Z9GT将发布 华为将举办鸿蒙春季沟通会 苹果与Shutterstoc...
-
软件测试 | Whisper:高效的语音识别与转录技术
语音识别技术在现代信息社会中扮演着越来越重要的角色。无论是语音助手、实时翻译还是自动转录,语音识别系统的应用都在不断扩展和深化。在众多语音识别技术中,OpenAI推出的Whisper引起了广泛关注。本文将深入介绍Whisper的功能、特点及其应用场景。...
-
双排组到一个刀硬嘴甜的小姐姐,打完发现她竟是AI大模型。
永劫无间手游,终于在今天开启二测。 这意味着,在本次测试结束后,正式公测就真离我们不远了。 不知道差友里面多少人运气好,今天能顺利进入服务器。 反正官方的各种评论区下面,那些没抽到资格的玩家,已经有点走火入魔了。 而官方(24工作室和网易伏羲实验室 )...
-
Llama 3 构建语音助手:将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成
Llama 3 构建语音助手:将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成 文章目录 Llama 3 构建语音助手:将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成 不同行...
-
Whisper-AT:抗噪语音识别模型(Whisper)实现通用音频事件标记(Audio Tagger)
本文介绍一个统一音频标记(Audio Tagger)和语音识别(ASR)的模型:Whisper-AT,通过冻结Whisper的主干,并在其之上训练一个轻量级的音频标记模型。Whisper-AT在额外计算成本不到1%的情况下,可以在单次前向传递...
-
苹果AI来了,压力给到华米OV
和其他手机厂商对比,苹果AI含金量如何? 苹果AI终于来了,华为、小米、OPPO、vivo这些手机厂商反倒没那么紧张了。 北京时间6月11日凌晨,在将近两个小时的苹果全球开发者大会WWDC上,苹果主要做了两件事,前一个小时介绍六大平台的系统更新(包括vis...
-
苹果与OpenAI官宣合作:四大科技巨头深受影响
快科技6月12日消息,在刚刚结束的苹果全球开发者大会(WWDC 上,苹果宣布与OpenAI达成合作,这一战略联盟预计将对AI领域竞争格局产生重大影响。 首先,苹果通过与OpenAI的合作,为其自主开发AI技术赢得了宝贵时间。这一合作不仅有助于苹果将先进的A...
-
WWDC24前瞻:苹果在AI领域疯狂追赶
WWDC24全球开发者大会预计将于北京时间6月11日凌晨01:00在Apple Park举行,据悉,本次WWDC的重点可能落在“生成式人工智能”上。根据目前泄露和爆料消息,Apple似乎准备在iOS、iPadOS、macOS等系统上广泛应用其新的人工智能系...
-
苹果OpenAI曝出「数十亿美元」合作,微软急了!纳德拉紧急约谈奥特曼
OpenAI和苹果已经确定联手,微软急了! 根据外媒The Information的报道,OpenAI和苹果的交易已经完成。而苹果将在多大程度上使用OpenAI的技术,目前尚不清楚。 业界猜测,这项交易,可能价值数十亿美元! 不过,微软对此就没那么高兴了...
-
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
不管你来自哪个城市,相信在你的记忆中,都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒…… 某种意义上说,方言不只是一种语言习惯,也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中,有不少就是来自各地方言。...
-
Altman被曝七宗罪,OpenAI竟欲加密GPU合作军方?员工大批离职团队濒临崩溃
【新智元导读】刚刚,有网友仔细总结了OpenAI的七宗罪,对Altman发出愤怒的诘问:为何计划跟踪GPU?为何合作军方?员工滚雪球式离职的消息不断曝出,整个对齐团队已经濒临崩溃,「说谎」「心口不一」的形象愈发鲜明,Altman正在失去民心。 OpenAI...
-
发布会对比惨烈,奥特曼发文暗讽谷歌!谷歌被曝疯狂重组迎击OpenAI
现在,OpenAI和谷歌的互怼,已经是摆在明面上了。 两天硝烟弥漫的发布会后,Sam Altman显然对OpenAI压过谷歌一头的表现非常满意。 就在刚刚,他在x上发文表示:「我努力不去过多思考我们的竞争对手,但我无法不去思考OpenAI和谷歌之间的美学...
-
OpenAI CEO:GPT-5会很特别 可能类似于一个 “虚拟大脑”
OpenAI 首席执行官 Sam Altman 在接受采访时透露了 GPT-4o 和 GPT5的一些信息。GPT-4o 是一款多模态大模型,可以跨文本、视频和音频进行推理。Sam Altman表示,他早就有用语音控制计算机的想法,而 GPT-4o 的综合推...
-
IMF警告:AI“海啸”正在冲击全球劳动力市场
国际货币基金组织(IMF)总裁克里斯塔利娜・格奥尔基耶娃(Kristalina Georgieva)日前表示,AI正在像“海啸”一样冲击着全球劳动力市场。 图片1.jpg 格奥尔基耶娃日前在瑞士国际问题研究所举办的一次活动上表示,AI可能会影响发达经济体...
-
Altman首提GPT-7设想:每个人都可以访问其计算资源!
出品 | 51CTO技术栈(微信号:blog51cto) Sam Altman最近提出了“通用基础计算”,即每个人都可以访问GPT-7的一部分计算资源。 奥特曼在最近一期的All in播客中说:“我想知道未来看起来是否更像通用基本计算,而不是通用基本收...
-
GPT-4o实际应用案例:盲人可以更好地“看见”世界
OpenAI和Be My Eyes合作推出了一款新的APP,旨在帮助视力受限人群实时了解身边场景并提供帮助。这款APP利用了最新的GPT-4o模型,结合了实时视觉和语音能力。 通过这款APP,盲人可以随时了解自己周围的环境,并通过语音助手的帮助做出一些决策...
-
OpenAI谷歌苹果再燃AI争霸战,谁将担纲「Her」时代王者?
新一轮AI大战,即将拉开序幕! 下周一,OpenAI将开启线上直播,官宣GPT-4升级,甚至还有一个超级「AI助手」等着我们。 OpenAI「音频AGI研究负责人」Alexis Conneau已更换主页背景,并与奥特曼同频——下周我们将会见证Magic...
-
OpenAI重磅更新定档下周一,奥特曼暗示会有「魔法」!
确认了,没有GPT-5,没有搜索引擎,但还会有惊喜! OpenAI今天官宣预告,即将在13日,下周一上午10点(太平洋时间)开启线上直播。 届时,会有全新的ChatGPT demo演示,以及GPT-4升级更新。 传送门:https://openai.c...
-
奥特曼"剧透"OpenAI发布会:不是GPT-5,也不是搜索引擎 媒体爆料:是语音助手
5月11日消息,美国时间周五,人工智能初创公司OpenAI CEO萨姆·奥特曼(Sam Altman)在社交媒体X上发布了一条推文,调侃称将在本周一揭晓的“新产品”“感觉像魔法一样”。 【图注】 萨姆·奥特曼: 不是GPT-5,也不是搜索引擎,但我...
-
苹果与OpenAI达成协议,iOS 18或将引入ChatGPT功能
苹果正在与 OpenAI 就将其技术引入 iPhone 达成最终协议,据彭博社的新报道。根据该报道,通过这项协议,苹果将能够在 iOS18的人工智能功能中提供由 ChatGPT 驱动的 “流行聊天机器人” 功能。 据彭博社报道,虽然苹果仍在与谷歌就人工智能...
-
OpenAI开发全新AI人机对话技术 支持识别物体和图像
据The Information消息,OpenAI正筹备展示一种革命性的人机对话技术。据可靠消息,这一技术将结合声音和文本,不仅能与用户进行流畅的交流,还具备识别物体和图像的能力,为用户带来前所未有的交互体验。 ChatGPT的开发团队已经向部分客户展示了...
-
华为发布新一代鸿蒙座舱:搭载千悟大模型
在今日的华为智能汽车解决方案发布会上,华为为我们带来了令人瞩目的新一代鸿蒙座舱,该座舱融合了智慧车机、智慧音响和智慧显示,为车主带来前所未有的智能体验。 这款新一代鸿蒙座舱不仅拥有先进的千悟大模型,还集成了盘古大模型、MindSpore异思计算框架以及异腾...
-
人工智能如何给智能手机带来革命性的转变?
人工智能(AI 一直被认为是各领域的核心功能技术,智能手机是展现新一代可能性和能量的典型例子。人工智能不再仅仅是匹配人类界面水平的问题,而是让设备比以往任何时候都表现得更好的问题。本文将讨论智能手机的人工智能,以及它将如何给现代智能手机带来革命性的变化...
-
文心一言APP上线定制专属声音功能 只需2秒即可
近日,文心一言APP上线新功能,让用户能够在短短两秒内打造出专属的定制声音。 想要体验这一神奇功能,只需打开文心一言APP,点击下方“+”,然后选择创建智能体。在声音选项里,你会发现一个名为“创建我的声音”的有趣功能。 操作起来非常简单,你只需按照系统提...
-
家庭安全的未来:新兴技术和趋势
在高度动态的技术世界中,家庭安全是一个至关重要的方面。 数字创新的注入已经完全改变了我们与环境互动的动态,并极大地提高了家庭安全标准。在这些进步中,智能家居集成是创新的光辉典范,其使房主能够轻松控制其安全系统以及其他家庭自动化功能。对家庭安全...
-
提示工程中的10个设计模式
我们可以将提示词定义为向大型语言模型(Large Language Model,LLM 提供的一个查询或一组指令,这些指令随后使模型能够维持一定程度的自定义或增强,以改进其功能并影响其输出。我们可以通过提供细节、规则和指导来引出更有针对性的输出,从而使提...
-
EMAGE官网体验入口 AI手势生成音频手势建模软件下载地址
EMAGE是一种统一的整体共话手势生成模型,通过表情丰富的掩蔽音频手势建模来生成自然的手势动作。它可以从音频输入中捕捉语音和韵律信息,并生成相应的身体姿势和手势动作序列。EMAGE能够生成高度动态和表现力丰富的手势,从而增强虚拟人物的互动体验。 点击前往...
-
苹果开发出新款AI:可“看懂”屏幕内容并语音回复
快科技4月2日消息,据媒体报道,苹果公司近日宣布,成功研发出一款前沿的人工智能系统ReALM(Reference Resolution As Language Modeling,即基于语言建模的参考解析)。 据悉,该系统具备卓越能力,能够精准解析屏幕上模糊...
-
让Siri不再智障!苹果定义新的端侧模型,“大大优于GPT-4,摆脱文本,可视化模拟屏幕信息,最小参数模型相较基线系统仍提升5%
撰稿丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 总被用户吐槽“有点智障”的Siri有救了! Siri自诞生以来就是智能语音助手领域的代表之一,但很长一段时间里,其表现并不尽如人意。然而,苹果的人工智能团队最新...
-
微软升级Azure AI语音服务 推出9种更真实的AI语音
微软近期对其Azure AI语音服务进行了重大升级,推出了9种新的更真实的AI语音,旨在为用户带来更加自然和沉浸式的对话体验。这次升级的核心是引入了零样本学习(Zero-shot)的文本到语音(TTS 模型,这些模型在提高合成语音自然度的同时,更好地模仿了...
-
三星表示需要通过生成式AI升级重新定义其语音助手Bixby
三星表示,他们可能会将生成式人工智能技术应用于其语音助手 Bixby,这是该公司一名高管告诉 CNBC 的。Bixby 于2017年随三星 Galaxy S8智能手机推出。该软件提供了多项功能,包括实时翻译或餐厅推荐。然而,语音助手通常较少具备对话功能,而...
-
小米SU7搭载AI大模型:小爱同学秒识前车车型
快科技3月28日消息,今晚,小米汽车首款车型小米SU7震撼登场,标志着科技巨头小米正式迈入新能源赛道。 据介绍,小米SU7搭载AI大模型,配合小爱同学语音助手带来全新智驾体验。官方统计,小爱同学发布7年,具有1.1亿月活动用户,每天2.08亿次激活。 小...