-
OpenAI开发者大会推出四大创新:提示词缓存可减少50%输入token成本
10月2日消息,美东时间10月1日OpenAI举行了年度开发者大会DevDay,推出系列新工具,包括四大创新:实时API(Realtime API)、视觉微调(Vision Fine-Tuning)、提示词缓存(Prompt Caching)、模型蒸馏(M...
-
全球首个语音指挥FPS AI ,腾讯魔方携最新AI成果亮相科隆展
AI究竟会如何改变游戏?这应该是全球游戏行业近年最为关注的问题之一。在最近正在德国举办的全球最大游戏展—科隆游戏展上,腾讯游戏魔方工作室群技术中心联合《暗区突围:无限》项目组,首次对外公布其全球首个语音指挥FPSAIF.A.C.U.L.的技术Demo。这是...
-
8人半年肝出开源版GPT-4o,0延迟演示全网沸腾!背后技术揭秘,人人免费用
【新智元导读】GPT-4o或许还得等到今年秋季才对外开放。不过,由法国8人团队打造的原生多模态Moshi,已经实现了接近GPT-4o的水平,现场演示几乎0延迟,AI大佬纷纷转发。 没想到,「开源版」GPT-4o这么快就来了! 昨夜,来自法国AI实验室kyu...
-
AI日报:SD 3宣布开源;中文语音AI天花板ChatTTS官网上线;Veo支持单图生成视频;ElevenLabs推多样化AI音频模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、抖音:将打击使用AI技术P图侮...
-
一上线就爆火出圈!中文语音AI天花板ChatTTS官网上线
还记得之前给大家推荐的中文语音AI天花板ChatTTS吗?这个可平替 GPT-4o的文本转语音项目一上线就爆火出圈,短短几天就在GitHub上斩获了16.9K的Star 量。 而现在,ChatTTS正式上线了官网,所有用户都可以直接在线体验了。 主要功能...
-
GPT-4o干掉初创全网实测,马斯克Karpathy等大佬纷表不服:OpenAI不过如此
OpenAI一夜之间,又干掉了一大批初创公司。 官方公布的全能模型GPT-4o的炸裂演示,即便过去了一天,依旧让全网深陷其中,无法自拔。 凭借实时语音视频对话,GPT-4o已经深入教育、翻译、视频会议等领域的变革。 OpenAI科学家Lilian W...
-
CharacterGLM体验入口 语言AI技术平台免费试用方法
CharacterGLM是智谱AI开放平台专注语言AI技术产业化落地的尖端工具。通过开放大模型芯片、语言模型API和各行业应用工具,让AI大模型的能力普惠于千行百业,帮助企业和开发者快速连接AI的力量,实现AI的产业化赋能,将AI技术的好处带给每个人。...
-
1分钟复刻明星语音,这家AI创企开年跻身独角兽
2024年第一个月,又一AI初创公司跻身独角兽: 专注于AI语音合成的ElevenLabs,刚刚完成8000万美元(约合人民币5.7亿元)B轮融资,估值超过10亿美元。 在语音克隆领域,ElevenLabs(11Labs)是公认的最强工具之一。 因霉霉说中...
-
AI盒子替你操作APP Rabbit R1是神器还是鸡肋?
2024CES展上,一款可以装进衣服口袋的AI硬件火了,名叫Rabbit R1的四方小设备只有巴掌大小,能连接WiFi、接打电话、登陆手机上的APP。无需操作,只需喊话,Rabbit R1会自动为你导航、叫车、订外卖;一双“AI眼”还能帮你“看看”未尽事务...
-
苹果关闭圣地亚哥AI团队,数据运营注解团队将迁至奥斯汀合并
据Bloomberg News报道,苹果计划关闭总数为121人的位于圣地亚哥的人工智能(AI)团队,该团队名为数据运营注解,上周已被告知他们将迁至奥斯汀,与一支类似的团队合并。这些消息的来源称,苹果告诉员工他们有一个月的时间来决定是否搬迁,如果选择不迁移,...
-
关于python环境下的语音转文本,whisper或funASR
因为前阵子,有需求要将语音转为文本再进行下一步操作。感觉这个技术也不算是什么新需求,但是一搜,都是大厂的api,或者是什么什么软件,由于想要免费的,同时也要嵌入在代码中,所以这些都不能用。、 一筹莫展的时候,突然搜到whi...