-
GPT-4o预告中的语音助手“Her”真的很惊艳,但问题是我们还有多久才能够真正上手?网友:PR鬼才奥特曼都坐不住了
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI 发布会中的GPT-4o给所有人都看眼馋了! 谁不想第一时间体验下传说中的“Her”呢? 图片 在发布会上,GPT-4o展示了自己的“magic”:高超的语音理...
-
李飞飞揭秘创业方向“空间智能”:视觉化为洞察,看见成为理解,理解导致行动
斯坦福李飞飞创业后,首次揭秘新概念“空间智能”。 这不仅是她的创业方向,也是指引她的“北极星”,被她认为是“解决人工智能难题的关键拼图”。 视觉化为洞察;看见成为理解;理解导致行动。 李飞飞最新15分钟TED演讲完整公开,从数亿年前生命进化的起源开始,...
-
“全家桶”战士归来,谷歌自我革命!
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 5月与6月,旧金山硅谷各大新贵旧王正在激烈角逐,主战场无疑则是AI。 就在昨天凌晨GPT-4o发布的24小时后,Google I/O大会也交卷了。 有意思的是,谷歌掌舵人皮查伊,好...
-
谷歌硬刚GPT-4o!60秒视频生成模型虽迟但到,上下文窗口达200万
OpenAI出手再次惊艳世界,谷歌果然坐不住了。 GPT-4o掀起的一片“AGI已至”的惊呼声中,刚刚,Google DeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场。 同样能会还有,不仅能几乎没有延迟地和人类流畅交流,通过摄像头,这个名为P...
-
抖音博主靠和ChatGPT赛博恋爱涨粉近50万 加上GPT-4o她岂不是要快乐升天
在当今数字化时代,人工智能(AI)的快速发展已经渗透到我们生活的方方面面,其中AI的情感交流功能尤其引人注目。最近,一位名为@午夜狂暴哈士奇狗的抖音博主与AI情感模式“DAN”之间的互动在网络上引起了巨大的关注。网友们通过视频见证了他们从相互调侃到间接表白...
-
思维链不存在了?纽约大学最新研究:推理步骤可省略
红极一时的思维链技术,可能要被推翻了! 还在惊讶于大模型居然能够利用思维链分步骤思考? 还在苦于不会写思维链提示词? 来自纽约大学的研究人员表示:「没关系的,都一样」, 推理步骤不重要,不想写提示词也可以不写,用省略号代替就行了。 论文地址:https...
-
万字长文总结提示词技巧!新加坡首届GPT-4提示工程大赛冠军最新分享
新加坡(GovTech)举办了首届GPT-4提示工程竞赛,Sheila Teo很幸运地取得了胜利。 提示工程是一门融合了艺术和科学的学科——它既是对技术的理解,也包含创造力和战略思维。 这次她和我们分享了她在学习过程中学到的提示工程策略,这些策略可以让任...
-
AI作品会侵权吗?我花了一个月时间,调研了你想知道的一切。
在AI越来越被普及之后,有越来越多的创作者下场,开始使用AI,来创作自己的一些作品。 但是在这个时间点,很多的创作者,都非常关心一个问题:AI版权。 特别是最近的有两个月,在聊天中有密集想了解的,比如影视飓风,比如某国企,比如港中大等等。 大家的问题几乎都...
-
ControlNet作者新作爆火:P照片换背景不求人,AI打光完美融入
ControlNet作者新作,玩儿得人直呼过瘾,刚开源就揽星1.2k。 用于操纵图像照明效果的IC-Light,全称lmposing Consistent Light。 玩法很简单: 上传任意一张图,系统会自动分离人物等主体,选择光源位置,填上提示词,就能...
-
甜晕网友!博主调教AI成理想男友展开赛博约会
近日,网上掀起了一股热议,关于博主@午夜狂暴哈士奇狗与AI情感模式“DAN”之间的故事。在这个令人称奇的情感交流中,网友们发现AI不仅能够理解人类的情绪和需求,还能与人产生深刻的情感联系。 据悉,DAN是ChatGPT的一种“擦边”模式,全称为Do Any...
-
剪映上线即梦AI:输入简单指令生成视频
快科技5月9日消息,剪映Dreamina官宣其品牌正式更名为中文即梦”,同时宣布其AI作图和AI视频生成功能已全量上线。 即梦”作为一个全新的品牌,其核心功能包括图片生成、智能画布和视频生成,旨在为用户提供更为便捷、智能的创作体验。 在图片生成方面,即梦”...
-
Krea AI正式发布视频生成功能 可自定义视频首尾帧
Krea AI 正式发布了其最新的视频生成功能,这一更新包括了自定义视频首尾帧和为每张图片定义提示词的能力。这些新功能在易用性上进行了显著改进,并且现在可以自动将生成的视频高清化,但仅限会员使用。 产品入口:https://top.aibase.com/...
-
Dreamina正式更名为“即梦” AI绘画和AI视频功能全量上线
今天,剪映Dreamina官方宣布其品牌正式更名为中文「即梦」,同时宣布其AI作图和AI视频生成功能已全量上线。用户现在可以通过电脑浏览器访问新域名来体验这些功能。 即梦入口:https://top.aibase.com/tool/jimengdream...
-
OpenAI神秘gpt2正在A/B测试,奥特曼抢先剧透,网友已玩嗨
OpenAI正在秘密A/B测试下一代模型,实力超强被怀疑是GPT-4.5或GPT-5。就在奥特曼当谜语人暗示之后,两款新模型悄悄上线大模型竞技场。 图片 Im-a-good-gpt2-chatbot Im-also-a-good-gpt2-chatbo...
-
大模型卷爆数字人:一句话5分钟实现定制,跳舞主持带货都能hold住
最快5分钟,打造一个直接上岗工作的3D数字人。 这是大模型给数字人领域带来的最新震撼。 就像这样,一句话描述需求: 生成的数字人直接就能进驻直播间当主播。 跳起女团舞也不在话下。 整个制作过程中,想到什么说什么就行,大模型都能自动拆解需求,瞬间get...
-
OpenAI Sora让创作者们工作轻松,他们还相信自己不会轻易被取代
5月6日消息,OpenAI文生视频工具Sora的早期测试者们似乎可以松口气了。他们并没有因为这款工具而出现即将被取代的恐慌,反而觉得它让他们的工作变得更加游刃有余。 今年2月,人工智能初创公司OpenAI正式推出了Sora,这款工具旨在“深入理解和模拟...
-
AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了
AI做数学题,真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升! 一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势,具体选择了什么token无...
-
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
除了计算资源和训练数据这些硬实力外,Llama3模型开源的训练思路覆盖了LLM模型的全部生命周期,提供了各种开源生态系统下的工具。 Llama3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。 最近,M...
-
GitHub版Devin上线,会打字就能开发应用,微软CEO:重新定义IDE
微软的“GitHub版Devin”——Copilot WorkSpace,终于上线了! WorkSpace是一种“Copilot原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。 也就是说,只要有想法,而且会打字,就可以...
-
神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜
一夜之间,大模型话题王,再次易主。 一个神秘模型突然杀入众人视野,能力超越一众开源模型,甚至包括GPT-4。几乎所有人都在谈论它,服务器都被挤爆了。 它就是“gpt2-chatbot”。 (注意啊,是gpt2不是GPT-2) 它有多强? IMO国际数学...
-
AI驱动增长的时代,广告投放有哪些新玩法?
营销竞争日益激烈,越来越多的广告主都开始用AI“卷”效率—— 在制作环节,AI能够在准确了解目标受众的同时,让品牌创意迅速落地。在投放环节,AI也能帮助品牌实现自动化投放和个性化推荐,提高广告的点击率和转化率,整个过程主打一个快、狠、准。 虽然在各大平台上...
-
深入理解并掌握 Spring AI 与 Open AI 的使用方法
Spring AI,作为行业领导者,通过其强大、灵活的API和先进的功能,为各种行业提供了颠覆性的解决方案。在本专题中,我们将深入探讨Spring AI在各领域的应用示例。每个案例都将展示Spring AI如何满足特定需求,实现目标,并将这些LESSON...
-
抖音推出AI相机类产品“星绘” 支持AI分身、 AI修图、文生图功能
据Tech星球报道,近期,抖音的Flow部门成功推出了一款名为“星绘”的APP,它是一款AI相机类的产品,为用户带来了全新的视觉体验。 星绘APP不仅可以创建用户的AI分身,还能提供多样化的分身效果定制。用户只需打开星绘APP,上传或拍摄3张头像照片,经过...
-
Sora大片真相:人工特效参与,被指误导大众
啊?Sora火爆短片《气球人》,也“造假”了??? 背后艺术家团队的最新揭秘,可谓一石激起千层浪: 原来,视频画面并非完全由AI生成,其中有大量视觉效果需要人类后期实现。 be like: 这下网友不干了,合着大家伙儿跟OpenAI玩真心,OpenAI...
-
百万网友围观博主和AI“谈恋爱”,ChatGPT“DAN”模式有多上头?
前方高能!AI会“谈恋爱”了! 近日,博主“午夜狂暴哈士奇狗”在视频中晒出和ChatGPT“DAN”的语音聊天,近百万网友见证了他们从互怼暧昧到间接表白,再到“见家长”的全过程。 DAN是“Do Anything Now”的缩写,在ChatGPT对话中输入...
-
无界AI算法总监邹国平:Midjourney领跑,没有标准答案的文生图,下半场还能怎么卷?
撰稿 | 李美涵 采访 | 云昭 嘉宾 | 邹国平 出品 | 51CTO技术栈(微信号:blog51cto) 进入2024,AI应用落地的步伐悄然加速。 AI文生图产品——连接着千行百业的设计需求,极大地压缩了创意实现的周期——正成为快速掘金的AI领域之...
-
阿里智能体“组装工厂”开源!0经验搞定上万Agent并发
让多智能体开发就像搭积木,阿里巴巴通义实验室开源多智能体编程框架与开发平台AgentScope。 该平台专门为多智能体应用开发者打造,旨在提供高易用的编程体验、稳定可靠的运行时保障,并且为开发者提供了分布式和多模态的技术支持。 内置了OpenAI、Das...
-
利用Spring Boot以及Spring AI构建生成式人工智能应用
Spring AI,作为行业领导者,通过其强大、灵活的API和先进的功能,为各种行业提供了颠覆性的解决方案。在本专题中,我们将深入探讨Spring AI在各领域的应用示例,每个案例都将展示Spring AI如何满足特定需求,实现目标,并将这些LESSON...
-
rabbit r1第一批买家秀来了!经历轰动与质疑后,AI硬件销冠诞生
1月9日,当rabbit inc.创始人吕骋站在摄像机前,首次向所有人举起手中那个四四方方的亮橙色迷你AI硬件时,他心里想的是:如果能卖出3千台就很高兴了。 仅仅24小时后,首批1万台r1就被预订一空。再补货,再售罄…几番回合下来,到三个月后的今天,r1销...
-
LLM 安全 | 大语言模型应用安全入门
一、背景 2023年以来,LLM 变成了相当炙手可热的话题,以 ChatGPT 为代表的 LLM 的出现,让人们看到了无限的可能性。ChatGPT能写作,能翻译,能创作诗歌和故事,甚至能一定程度上做一些高度专业化的工作,比如法律服务和医疗诊断咨询。...
-
挑战拯救痴心“舔狗”,我和大模型都尽力了
天降猛男,大模型化身为 “痴情男大”,等待人类玩家的拯救。 一款名为 “拯救舔狗” 的大模型原生小游戏出现了。 游戏规则很简单:如果玩家在几轮对话内说服 “他” 放弃追求对他并无青睐的女神,就算挑战成功。 听起来并不难,然而游戏源于生活,模型人设是痴情属...
-
黑照变废为宝!超能AI一句话修出创意大片,亲妈看了都说真
2024最wow的AI生图工具出现了! 对“青春纪念手册”下手,你就说这味儿正不正宗: 不信谁没有,谁也别说谁。 别着急,下一秒“啪”的一下: ……什么情况? 这,就是最近摄影圈不少人都在玩的AI修图神器——超能画布。 据说只需一句提示词就能分分钟修出...
-
AI音乐生成工具AI Jukebox 输入提示词选择曲风即可创作音乐
AI Jukebox 是一个利用人工智能技术的音乐生成工具,它通过Hugging Face平台提供服务。这个工具的设计理念在于简化音乐创作过程,使其变得更加智能化和用户友好。 主要功能特点: 本地化模型加载:用户打开AI Jukebox的网页后,系统会自...
-
开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了
虽然大型语言模型(LLM)在各种常见的自然语言处理任务中展现出了优异的性能,但随之而来的幻觉,也揭示了模型在真实性和透明度上仍然存在问题。 在模型生成错误回复内容时,如果能够「深入理解其背后运行机制」,或许可以解决模型的幻觉问题。 然而,随着深度神经网络...
-
AI日报:微软发布iPhone可运行AI模型;全国首例AI声音侵权案判了;Kimi创始人套现数千万美金;中文聊天模型Llama3发布
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、腾讯SaaS产品智能化升级 全...
-
新测试基准发布,最强开源Llama 3尴尬了
如果试题太简单,学霸和学渣都能考90分,拉不开差距…… 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。 大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。...
-
GPT-4化身黑客搞破坏,成功率87%,OpenAI要求保密提示词,网友复现ing
91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模...
-
GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing
91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模...
-
单篇赚两万,AI写短剧是噱头还是风口?
重生之我用AI写短剧故事。 打开MidReal最新网页版,页面中间偌大的标语写着“What’s your fantasy?(你的幻想是什么?)”和引导用户输入提示词的对话框。 免费体验网页版MidReal链接:https://midreal.ai/ 如果...
-
AI音乐生成器Udio地址多少 Udio怎么用详细使用教程
Udio是一款引起广泛关注的AI音乐生成工具,用户可以通过简单的文字描述轻松创作带有歌词的音乐作品。这款工具支持多种音乐类型和风格,如EDM、钢琴爵士、新灵魂乐等,满足不同用户的需求。同时,用户还可以根据个人喜好...
-
巨日禄ai官网入口 AI绘画小说转视频工具免费使用地址
巨日禄AI是一款全网性能卓越的故事AI绘画转视频工具。该工具致力于让 0 基础小白用户也能轻松上手,快速实现从文案到视频的制作。通过分析大量剧本数据和影视作品,为用户提供各种类型的故事情节和角色设置,帮助用户快速找到灵感,减少构思剧本的困难和犹豫。支持配音...
-
AI音乐生成器Udio怎么用?Udio怎么生成音乐详细使用教程(附使用地址)
产品简介: AI音乐生成工具Udio正式发布,用户可以通过简单的文字描述创作带有歌词的音乐作品。这一新工具极大地降低了音乐创作的门槛。Udio支持广泛的音乐类型和风格,包括EDM、钢琴爵士、新灵魂乐、极端金属等,...
-
巧用Stable Diffusion,实现不同风格的LOGO设计|实战篇幅,建议收藏!
大家好,我是程序员晓晓 Logo,作为品牌的视觉核心,其重要性不言而喻。它不仅是品牌的标识,更是品牌精神和文化的体现。一个成功的Logo能够简洁而有力地传达品牌的信息和特质,使消费者在短时间内就能对品牌产生深刻的印象。 在Logo的设计过程中,极简与象...
-
Ai绘画工具,Stable Diffusion插件使用攻略
今天给大家分享一下Stable Diffusion的插件使用攻略。 一、什么是插件 Stable Diffusion的插件主要是用来丰富SD的一些功能,例如C站助手,提示词助手,图片信息助手等插件都是为了增强SD的实用性。 二、安装插件 我...
-
AI绘画SD迎来动画革命,AnimateDiff快速出图
如果放在几年前,你告诉我说只需一分钟就能做出一段这样的动画,我是万万不相信的,但是当AI时代来临之后,一切都有了可能。 今天给大家介绍一个可以快速在sd中生成动画的方法,就是一个叫做AnimateDiff的免费开源项目。现在已经整合到了webUI上面,使...
-
Stable Diffusion生成诗词背景图
文章目录 安装Stable Diffusion 使用整合包 功能讲解 生成诗词背景图 API调用 安装Stable Diffusion 网上有许多大神整合的 Stable Diffusion 整合包,这里可以到B站下载秋叶的整合包...
-
Stable Diffusion 绘画入门教程(webui)-ControlNet(Tile/Blur)
上篇文章介绍了y语义分割Seg,这篇文章介绍下Tile/Blur(增加/减少细节) Tile用于增加图片细节,一般用于高清修复,Blur用于减少图片细节(图片模糊),如下图,用Tile做修复:左边为原图(比较模糊),右边就是高清修复后的图(还是拿之前的小...
-
文生图——stable diffusion生成有趣的动漫图像
Stable Diffusion是一个文本转图像的模型,由CompVis、Stability AI和LAION共同开发。它能够从一段简单的文本输入中快速生成相应的图像。此外,它还可以导入图像并配合文本对其进行处理。从技术角度来看,Stable Diffus...
-
如何写好Stable Diffusion的prompt
Stable Diffusion是一种强大的文本到图像生成模型,其效果在很大程度上取决于输入的提示词(Prompt)。以下是一些关于如何编写有效的Stable Diffusion Prompt的秘诀: 明确描述:尽量清晰地描述你想要的图像内容。使...
-
RAG 修炼手册|一文讲透 RAG 背后的技术
在之前的文章中《RAG 修炼手册|RAG敲响丧钟?大模型长上下文是否意味着向量检索不再重要》,我们已经介绍过 RAG 对于解决大模型幻觉问题的不可或缺性,也回顾了如何借助向量数据库提升 RAG 实战效果。 今天我们继续剖析 RAG,将为大家大家详细介绍...