-
OpenAI“草莓”值万亿吗?
奥特曼和马保国有什么共同点?答:都爱搞偷袭。 “草莓”的消息已经传了几个月,据说这是OpenAI内部的一个神秘项目,似乎和前代模型颇有些不同。但OpenAI一直讳莫如深,最接近曝光的时刻,是此前CEO山姆·奥特曼(Sam Altman)在社交媒体上发布的一...
-
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。 按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1来...
-
OpenAI支持的最强实体“ChatGPT机器人”,8月6日发布
Figure.AI联合创始人Brett Adcock宣布,将于8月6日(大约北京时间周二凌晨左右)发布Figure02型号。 Brett没有过多的介绍Figure02新功能和技术特性,只放出了一句狠话——这将是地球最强的人形机器人。 从Figure01...
-
OpenAI和Google接连两天的大动作,都想让AI助手成“精”
看过昨天OpenAI的春季发布后,不难猜到,在今天的谷歌I/O大会上,必然会有关于AI助手的介绍。 毕竟,抢在谷歌I/O大会前发布GPT-4o的Altman,已经显示出了十足的针对性,凭借Altman的手段,自然也有着十足的把握做到精准打击,将这场“红蓝...
-
两小时“吼出”121次AI,谷歌背后埋伏着Open AI的幽灵
谷歌和Open AI的又一次对阵,刚刚落幕了。 北京时间5月14日凌晨,OpenAI发布端到端多模态AI大模型GPT-4o,酷似科幻电影《Her》的AI语音对话迅速成为关注焦点。 24小时后,携新版Gemini AI大模型等产品,谷歌在北京时间5月15日凌...
-
GPT-4o实际应用案例:盲人可以更好地“看见”世界
OpenAI和Be My Eyes合作推出了一款新的APP,旨在帮助视力受限人群实时了解身边场景并提供帮助。这款APP利用了最新的GPT-4o模型,结合了实时视觉和语音能力。 通过这款APP,盲人可以随时了解自己周围的环境,并通过语音助手的帮助做出一些决策...
-
PR+AI重新定义视频剪辑,Sora、Pika全接入,AI视频创企还有的玩吗?
还记得网友们用PS的Generative Fill花式整活的盛况吗? 接下来,被网友玩坏的可能要轮到PR了。 无论你是专业的视频剪辑师,还是业余爱好者,对Premiere Pro(简称PR)这款软件都一定不陌生。 前几天,Adobe官方发布了一条视频,快...
-
让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 在探索人工智能边界时,我们时常惊叹于人类孩童的学习能力 —— 可以轻易地将他人的动作映射到自己的视角,进而模仿并创新。当我们追求更高阶...
-
如何开启Windows Copilot
如何开启Windows Copilot 前情提要:MVP成员FireCube被除名 透露的教程指向这篇文章 (https://firecube.news/posts/7074855605369835520 ,此外Blog里面还有更多使用ViVeTool...
-
基于ChatGPT的人型机器人Figure01据称能帮忙做家务
据报道,由OpenAI的ChatGPT驱动的最新自动人型机器人在外观上与科幻电影中的机器人形象有相似之处,但并非杀人机器。这款名为Figure01的新机器人能够执行基本的自主任务,并能够与人进行实时对话,这都是在ChatGPT的帮助下实现的。 据Figur...
-
上热榜了!抖音博主被曝用AI作品欺骗观众;看看Sora炸出来多少好东西;我帮你踩遍了AIGC创业的各种坑;图解 Stable Diffusion | ShowMeAI日报
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 👀 抖音知名绘画博主被曝作品是AI制作的,然后道歉也是 ChatGPT 生成的? 2月21日,抖音知名绘画博主 @曾bobi 发布了最新作品,是他们几...
-
AI视频生成工具使用方法介绍详解 Stable Video官网体验入口
Stable Video是一个基于AI的视频生成平台。用户可以通过文本或图像,将概念转化为引人入胜的视频。平台采用了最先进的深度学习技术,可以高质量生成各类视频内容,包括商业宣传视频、教学视频、演示视频等。优势是生成速度快,质量高,使用简单方便。定价采用创...
-
Sora视频生成器官网体验入口 AI视频生成工具怎么使用
Sora视频生成器是一个可以通过文本生成高质量AI视频的在线网站。用户只需要输入想要生成视频的文本描述,它就可以使用OpenAI的Sora AI模型,转换成逼真的视频。网站还提供了丰富的视频样例,详细的使用指南和定价方案等。 点击前往Sora视频生成器官...
-
Sora文生视频模型怎么用?OpenAI官方最全演示案例视频、Prompt中文提示词汇总整理及详细教程使用入口地址
OpenAI 最近发布了一款名为 Sora 的「文生成视频」模型,只需输入文字即可生成一段 60 秒的惊人视频。 对于 Sora 的连日刷屏引爆全网,有券商表示,近期随着 Sora 的出现,一些人认为这标志着...
-
StableVideo官网体验入口 Stability Al视频生成AI工具在线使用地址
Stable Video是一个基于AI的视频生成平台,旨在帮助用户将文本或图像转化为引人入胜的视频内容。该平台采用了领先的深度学习技术,能够快速高质量地生成各类视频,包括商业宣传、教学培训和演示等视频。用户只需提供相关内容,即可轻松创建出令人印象深刻的视频...
-
StableVideo文生视频官网入口 一键AI视频生成软件网页版免费使用地址
Stable Video是一个基于AI的视频生成平台,用户可以通过文本或图像将概念转化为引人入胜的视频。以下是该平台的详细介绍: Stable Video工作原理 基于AI技术:采用最先进的深度学习技术,高质量生成各类视频内容。 生成速度快:一键...
-
周鸿祎谈Sora模型:中美AI差距可能还在加大
2月17日消息,近日,OpenAI 发布了 Sora 模型,该模型可根据用户输入的文本提示词描述,生成一段60秒钟的视频内容。从OpenAI公开的演示视频来看效果非常超现实。 昨日,360董事长周鸿祎在微博发文,谈到OpenAI的文字转视频模型Sora。他...
-
从声音到形象,AIGC 赋能的 TT 语音年度盛典有多好玩?
摘要: 23年是 AIGC 暴热的一年,这一年我们既兴奋又彷徨。兴奋之处在于新技术持续突破,业界“百模大战”的白热化,一些创新应用开始崭露头角,例如 ChatGPT 和 DALL·E 3,Midjourney,HeyGen, 星野,Copilot 等。彷...
-
徒手搬螺丝,波士顿动力Atlas再进化:兄弟们,准备进厂了
在如今颇为火热的人形机器人赛道,波士顿动力是较早入局的一位选手。 过去几年,Atlas 人形机器人的动态跑酷能力已经让全世界的关注,后来我们还看到 Atlas 在模拟建筑工地上搬搬扛扛。Atlas 目前仍然是一个开发平台,尚不能在现实世界中工作,一部分原...
-
Mobile-Agent: 具有视觉感知 可以像人类样操作手机的自主多模态AI代理
Mobile-Agent是一款具有视觉感知的自主多模式移动设备代理,由北京交通大学联合阿里巴巴团队共同开发。简单的说,Mobile-Agent相当于一个可以模拟人类操作手机的自主多模态AI代理。 该代理采用纯视觉解决方案,独立于XML和系统元数据,不需要...
-
Finalframe官网体验入口 AI视频生成软件在线使用地址
Finalframe是一款基于AI的视频剪辑工具。它通过支持将文本转化为视频,为用户提供了一个简单易用的视频制作平台。用户只需输入文字描述,Finalframe就能自动生成视频素材。这款工具还提供了直观方便的剪辑界面,用户可以通过拖拽、添加、删除等操作,快...
-
NetSuite 文心一言(Ernie)的AI应用
有个故事,松下幸之助小时候所处的年代是明治维新之后,大量引用西洋技术的时期。当时大家对“电”能干什么事,充满好奇。“电能干什么?它能帮我们开门么?” 松下幸之助的爷爷对电不屑,于是就问他。松下幸之助的回答是“也许可以,虽然不知道该怎么干。总要试一试。”...
-
生成式 AI 带给软件开发的三个幻觉:速度快、质量高、人更少
作者 | 张凯峰 软件行业苦降本增效久已。蔓延开去的开发周期,遥遥无望的上线时间,以及不断冒起的缺陷,怎么看都配不上这支精兵强将的队伍。生成式AI 似乎带来了曙光,它的表现让人耳目一新,不少人会这么想。它能自动生成代码,成本低,可重复,即抛的能力像云上的...
-
马斯克发“擎天柱”机器人叠衣服视频 动作虽慢但自然
1月16日消息,当地时间周一特斯拉首席执行官埃隆·马斯克(Elon Musk)在社交媒体X上发布了公司人形机器人“擎天柱”(Optimus)叠衣服的演示视频,令人印象深刻。 特斯拉最终希望人形机器人能够帮助制造汽车,但目前还不能做到这一点。 当该公司首...
-
中国电脑用户换机潮来了!联想展示AI PC用起来和普通PC有什么区别
快科技1月14日消息,毫无疑问,2024年将是AI PC的元年。IDC预测,AI PC新机的装配比例将在未来几年中快速攀升,将于2027年达到81%,成为PC市场主流。 CES期间,英特尔CEO帕特基辛格表示,如果说个人电脑是达尔文式”的设备,而AI PC...
-
机器人又拿下一种家务:10小时学会煮咖啡,仅需观看人类演示视频
上周斯坦福炒虾机器人炸场之后,又火了一个煮咖啡机器人。 它的厉害之处在于通过观看人类的示范视频,仅需10小时端到端训练,就能学会并完全自主搞定这一任务。 当然,更准确地来说是操作咖啡机: 只见它打开机盖、放入咖啡包,再按下开始按钮,整个过程一气呵成,无...
-
Gemini 是谷歌迄今为止最佳的 AI 模型 但充满希望的基准测试和演示最终引发了批评
谷歌近日公布了其最新的人工智能模型 Gemini,旨在缩小与 OpenAI 之间的差距,并给行业留下深刻印象。该模型展示了强大的基准测试成绩,并通过一段引人注目的视频演示和即时的可用性(尽管是功能受限版本),彰显了谷歌的自信。 然而,随着 AI 工程师和...
-
研究人员发现,谷歌Gemini表现不如GPT-3.5 Turbo
在近期的一项研究中,来自卡内基梅隆大学和BerriAI的研究团队对Google Gemini Pro进行了深入的评估,并发现其在多项任务中表现不如OpenAI的GPT-3.5Turbo。这一发现无疑是对Google在生成式人工智能领域与OpenAI竞争的雄...
-
StableVideo:使用Stable Diffusion生成连续无闪烁的视频
使用Stable Diffusion生成视频一直是人们的研究目标,但是我们遇到的最大问题是视频帧和帧之间的闪烁,但是最新的论文则着力解决这个问题。 本文总结了Chai等人的论文《StableVideo: Text-driven consistency -...
-
论文笔记:The Impact of AI on Developer Productivity:Evidence from GitHub Copilot
0 abstract 本文介绍了一项对GitHub Copilot(一种人工智能编程助手)的控制实验结果。 研究人员招募了软件开发人员,要求他们尽可能快地用JavaScript实现一个HTTP服务器。实验组可以访问人工智能编程助手,比对照组完成任务的...
-
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
大模型现在真的是越来越卷了! 11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的流量。 谷歌被逼急了,赶在年底之前仓促发布了超大模型Gemini,卷起了多模态,甚至不惜「视频造假」。 就在今天,微软正式发布了曾在11...
-
微软发布小型语言 AI 模型 Phi-2,性能优于 Llama 2、Mistral 7B
微软研究院当地时间周二宣布其 Phi-2 小型语言模型(SML),这是一款文本到文本的人工智能程序,据 X 平台的一篇帖子称,它「足够小,可以在笔记本电脑或移动设备上运行」。 Phi-2 拥有 27 亿参数,性能堪比其他更大的模型,包括 Meta 的 L...
-
谷歌副总裁 Sissie Hsiao:Gemini AI 演示视频「完全真实」,尽管谷歌「为了简洁而缩短了部分内容」
在日益激烈的生成型 AI 市场竞争中,谷歌近期推出了其大型语言模型 Gemini 的预告视频。然而,有关该视频真实性的争议随后引发了广泛关注。 谷歌发布的演示视频展示了 Gemini 模型的多模态能力,能够巧妙地解读并处理来自实时视频和音频的信息。这对谷...
-
谷歌祭出多模态“杀器” Gemini真能碾压GPT-4吗?
“最大”、最有能力”、“最佳”、“最高效”,谷歌为其12月7日新发布的多模态大模型Gemini冠上了好几个“最”,与OpenAI GPT-4“比高高”的胜负欲呼之欲出。 区分为Ultra、Pro、Nano三个尺寸的Gemini,不仅号称在各种“AI考试”中...
-
谷歌承认 Gemini AI 模型演示视频不是真实的:使用静态图像帧,并撰写文本提示供 Gemini 回应
Google 刚刚宣布了其迄今为止最强大的 AI 模型套件 Gemini,但该公司已被指控在其宣传视频中对其性能进行了误导性表述。 根据彭博社专栏作家帕尔米·奥尔森(Parmy Olson)的观点文章,Google 在一段视频中误导了公众对 Gemini...
-
视频AIGC“王者” Pika诞生 半年估值2亿美元
华人团队、估值过亿、OpenAI联创参投,视频AI生成工具Pika1.0一诞生就叠满Buff,短短几天火爆全网,社区用户超55万,被网友评价为目前最好的视频生成工具,俨然成了同类公司Runway创建的Gen-2的最强竞品。 Pika1.0背后的公司Pika...
-
DeepMind发现,AI代理可以通过模仿人类和其他动物进行社会学习
Google DeepMind的机器学习研究团队最近宣布,他们成功证明了人工智能(AI)代理可以通过社会学习的方式获取技能,类似于人类和其他动物的学习过程。这一成果被认为是在人工智能领域的重大突破,为实现人工通用智能迈出了一步。 研究团队由Google D...
-
被“薄纱”的文心一言,真的一无是处?
大家好,我是王有志,欢迎和我聊技术,聊漂泊在外的生活。本文单纯讨论文心一言,不涉及其母公司百度的所作所为 3月16日百度交卷了,正式推出了自己的知识增强大语言模型文心一言。 作为全球第二家,中国第一家正式推出的大语言模型,文心一言被很多人寄予厚望,期...
-
Stability AI推出视频生成模型Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的视频生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成视频。与其他AI公司不同,Stable Video Di...
-
YouTube 推出可模仿著名歌手的 AI 工具,可用文字或哼唱创作歌曲
11 月 16 日消息,YouTube 正在测试新的生成式 AI 功能,让用户可以通过输入文本或哼唱一段旋律来创作音乐。其中一个功能叫做 Dream Track,已经向平台上的一些创作者提供,它可以根据著名艺人的风格自动生成 30 秒的音乐片段。该功能可...
-
10分钟定制一个「陈天奇GPT」,OpenAI新品大波实测来袭!Sam Altman降维打击,千家AI初创公司入土
OpenAI首届春晚,创业公司屠杀夜。 正如Sam Altman所言:「我们正在孕育新物种,它们正在迅速增殖。」 图片 可以说,基于OpenAI接口构建创业公司,产品忽然就失去了意义。许多初创公司的产品,已经没有了护城河。 杜克大学教授陈怡然表示,照这个...
-
基于Labview的声音采集系统设计 利用麦克风对声音进行采集,并对采集的声音叠加30、3000Hz噪声,并通过滤波器进行滤除
基于Labview的声音采集系统设计 开发环境为Labview2017 功能:利用麦克风对声音进行采集,并对采集的声音叠加30、3000Hz噪声,并通过滤波器进行滤除。 显示各阶段声音的波形图,可对各阶段声音文件进行保存。 自带滤波器效果不好。 带有演示视...
-
BS1071-基于javaweb+springboot实现医疗健康档案大数据采集清洗数据分析可视化系统
本医疗健康档案大数据采集清洗数据分析可视化的设计与实现,系统主要采用java,springboot,动态图表echarts,vue,mysql,mybatisplus,医疗健康档案数据分析,html,css,javascript等技术实现,主要通过互联网采...
-
波士顿动力推出 AI 集成的机器人狗 Spot:打造未来互动导游
波士顿动力公司近日推出了其新一代机器人狗 Spot,这是一种配备了聊天机器人技术的智能导游机器人。Spot 不仅能走动和交谈,还能以其独特的英国口音为游客提供场所导游服务。通过与 ChatGPT 及其他开源大型语言模型(LLMs)的集成,Spot 能够精准...
-
荣耀Magic 6引入AI功能 可通过眼睛凝视控制手机
华为旗下的荣耀(Honor)品牌在2023年高通骁龙峰会上宣布了其最新旗舰手机荣耀Magic6,并引入了一项名为Magic Capsule的创新功能。这项功能基于眼动追踪技术,允许用户通过眼睛的凝视来控制手机应用程序的打开和操作。尽管这一技术引发了一些关于...