-
Google Photos即将允许用户自定义AI生成视频亮点
Google Photos即将推出一项更新,允许用户更灵活地自定义其AI生成的视频亮点。目前,Google Photos可能随机生成带有通用标题的幻灯片式视频,有时包括一些不太理想的照片。但Google即将发布一项更新,让用户能够选择视频的参数,而不仅仅...
-
Meta推大模型记忆增强方法MemWalker 靠prompt就能完成,无需额外训练
一项名为MemWalker的新技术,使大型语言模型能够克服其窗口长度的限制,从而可以处理更长的文本并回答相关问题,而无需进行额外的训练。这一技术的开发团队使用了一种树形记忆策略,该策略的工作原理包括两个主要阶段:记忆树构建和导航检索。 图源备注:图片由A...
-
UniPAD:自动驾驶通用预训练范式来了!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 UNIPAD:自动驾驶通用预训练范式 原标题:UNIPAD: A UNIVERSAL PRE-TRAINING PARADIGM FOR AUTONOMOUS DRIVING 论文链接:https:/...
-
讯飞星火和文心一言有什么区别?讯飞文心一言哪个厉害
讯飞星火和文心一言是两个不同的产品,各自有其特点和优势。那么讯飞星火和文心一言有什么区别哪个更厉害呢?下面就给大家带来讯飞星火和文心一言的特点介绍。 1. 讯飞星火: 讯飞星火认知大模型可用于语言理解、知识问答、代码编写、逻辑推理、数学解题等场景。讯飞星火...
-
高通正式发布骁龙 8 Gen 3 旗舰芯片:为 2024 年安卓旗舰手机带来生成式 AI 革命
在今天的 2023 年夏威夷 Snapdragon 峰会上,高通公司正式发布了其最新的顶级芯片组 Snapdragon 8 Gen 3。借助于这款新芯片,预计 2024 年的 Android 旗舰手机将迎来备受期待的生成型人工智能(AI)革命。 Sna...
-
元象 XVERSE 与腾讯音乐推出 lyraXVERSE 加速大模型
元象 XVERSE 与腾讯音乐合作推出 lyraXVERSE 加速大模型,将应用于音乐助手 “AI 小琴” 中。 用户可以通过点击 QQ 音乐上的 “AI 一起听” 按键来与升级版的 “AI 小琴” 互动,她将根据用户的提问、播放习惯和心情提供闲聊、推歌、...
-
微软砍掉工业元宇宙项目Project Airsim 将人工智能战略转向OpenAI
10月25日消息,据外媒援引知情人士透露,本周一微软负责开发“工业元宇宙”Project Airsim的团队成员都收到了一份“团队更新”的通知,并被告知公司将解雇整个团队并终止项目。微软也证实,将于今年12月15日终止该项目。 微软在一份声明中表示:“...
-
最高20倍!压缩ChatGPT等模型文本提示,极大节省AI算力
在长文本场景中,ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题,微软开源了LongLLMLingua。 据悉,LongLLMLingua的核心技术原理是将“文本提示”实现最高20倍的极限压缩,同时又可以准确评估...
-
OpenAI首批投资者科斯拉:大多数AI创企价值都被高估了
10月25日消息,当人工智能初创公司OpenAI在2019年从非营利组织转变为“利润上限(caped-profit)”公司时,硅谷风险投资家维诺德·科斯拉(Vinod Khosla 大胆地迈出了第一步。他旗下的科斯拉风投公司向OpenAI投资了5000...
-
骁龙8 Gen3正式发布:8K240手游成真!AI无处不在性能飙升98%
快科技夏威夷高通骁龙技术峰会2023现场报道: 一年一度,它又来了!但是今年,它来得更早一些! 北京时间10月24日,高通正式发布了新一代旗舰移动平台骁龙8 Gen3”(第三代骁龙8 ,安卓旗舰手机一年一度的新平台登场。 在激烈的残酷竞争下,在AI时代浪潮...
-
GameGPT:使用AI实现游戏开发自动化
译者 | 布加迪 审校 | 重楼 如今,从事游戏开发如同走钢丝。游戏行业处于一种怪异的境地:游戏变得越来越酷,越来越有开创性,但同时也变得越来越让人头疼:更大的团队、更长的工作时间以及巨额预算。相信我,我知道从事这个行当有多难:我和好友Jim花了两年多...
-
高通推出骁龙XElite——AI赋能的强大平台将为PC带来变革
在骁龙峰会期间,高通技术公司宣布推出公司迄今为止面向PC打造的最强计算处理器:骁龙XElite。这款开创性平台将开启顶级计算新时代,凭借一流的CPU性能、领先的终端侧AI推理和支持多天续航的高能效PC处理器,显著提升PC体验。AI正在变革人们与PC的交互方...
-
高通发布第三代骁龙8移动平台,为下一代旗舰智能手机带来生成式AI
在今日凌晨的骁龙峰会期间,高通技术公司正式推出全新旗舰移动平台——第三代骁龙®8,它是一款集终端侧智能、顶级性能和能效于一体的强大产品。作为Android旗舰智能手机SoC领导者,高通技术公司的全新平台将在全球OEM厂商和智能手机品牌的终端上得到广泛采用,...
-
微软更新 Skype 应用:改进通话界面、优化相机体验、增强必应聊天
10 月 25 日消息,微软近日更新了 iOS 和安卓版 Skype 应用,邀请 Skype Insider 项目成员,测试安装 Build 8.106.76.206。本次版本更新重点改善了通话界面,优化了相机体验,修复了多处错误。 IT之家在此附上...
-
微软CEO纳德拉:我经历过四次重大转变 AI是第五次
10月23日消息,近日,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在媒体专访中表示,其经历过四次重大转变,目前正在经历第五次重大转变,即人工智能。 纳德拉还表示,如果不能适应新的技术转变,那么可能会失去一切。 此外,纳德拉在采访中称,完...
-
八款旨在窃取数据的假冒ChatGPT恶意应用
译者 | 陈峻 审校 | 重楼 目前,人们已开始逐渐习惯于借助ChatGPT开展各种日常工作,包括:搜寻答案、生成图文内容、解释复杂概念、以及编写程序代码等。不过,相对付费版本,免费版聊天机器人的局限性,往往体现在答复的准确性和时间延迟上。而恶意行为者已...
-
ChatGPT与DALL·E 3之间的行业「黑话」被人发现了
上个月底,OpenAI 发布了最新图像生成器 DALL・E 3,除了炸裂的生成效果外,最大看点是其与 ChatGPT 的集成。 DALL・E 3 构建在 ChatGPT 之上,用 ChatGPT 来创建、拓展和优化 prompt。这样一来,用户无需在 p...
-
陶哲轩疯狂安利Copilot:它帮我完成了一页纸证明,甚至能猜出我后面的过程
继给GPT-4“代言”之后,Copilot也被陶哲轩疯狂安利。 他直言,在编程时,Copilot能直接预测出他下一步要做什么。 有了Copilot之后,研究做起来也更方便了,陶哲轩也用它辅助自己完成了最新的研究成果。 陶哲轩说,这次的论文中,有关这一部...
-
让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%
大模型“识图”能力都这么强了,为啥还老找错东西? 例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有鱼类…… 这是因为,我们让大模型“找东西”时,往往输入的是文本。 如果描述有歧义或太偏门,像是“bat”(蝙蝠还是拍子?)或“魔鳉”(Cy...
-
首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路
笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度上的长尾场景:如障碍物数据中近距离的车辆以及切车过程中...
-
深度学习科研,如何高效进行代码和实验管理?
回答一 作者:叶小飞 链接:https://www.zhihu.com/question/269707221/answer/2281374258 我之前在北美奔驰落地时,曾有段时间为了测试不同的结构和参数,一周能训练一百来个不同的模型,为此我结合公司前...
-
明年IT投资前景看好:增速比GDP高三倍!75%的CIO要为AI多花钱
如今全球复苏依旧缓慢,根据国际货币基金组织(IMF)最近发布的《世界经济展望报告》,预计全球经济增速将从2022年的3.5%放缓至2023年的3.0%和2024年的2.9%。然而,Gartner的IT支出数据却与此呈现出鲜明的对比:2024年全球IT支...
-
「解释一切」图像概念解释器来了,港科大团队出品
你是否好奇当一个黑盒深度神经网络 (DNN 预测下图的时候,图中哪个部分对于输出预测为「击球手」的帮助最大? 香港科技大学团队最新的 NeurIPS2023 研究成果给出了他们的答案。 论文:https://arxiv.org/abs/2305....
-
IBM 推出 AI 芯片 NorthPole:内置存储器,号称可“模拟人脑运行”
▲ 图源 IBM 10 月 24 日消息,IBM Research 日前推出 AI 芯片 NorthPole,该芯片灵感号称“来自人类大脑的运作”,推论性能据称超越 4nm GPU,适用于边缘计算等范畴。 IT之家经过查询得知,NorthPole 芯片是...
-
英伟达被曝入局PC端CPU!网友:眼馋苹果M1打开市场
GPU狂魔英伟达,突然盯上笔记本CPU了! 据路透社爆料,英伟达已经开始悄悄设计基于Windows系统的PC端CPU,对标苹果ARM架构芯片。 最早在2025年,我们就可能看到英伟达的笔记本芯片。 要知道,之前在Windows操作系统这块,PC市场的主...
-
4k窗口长度就能读长文,陈丹琦高徒联手Meta推出大模型记忆力增强新方法
只有4k窗口长度的大模型,也能阅读大段文本了! 普林斯顿的华人博士生的一项最新成果,成功“突破”了大模型窗口长度的限制。 不仅能回答各种问题,而且整个实现的过程全靠prompt就能完成,不需要任何的额外训练。 研究团队创建了一种名为MemWalker的...
-
数据分析和机器学习的11个高级可视化图表介绍
可视化是一种强大的工具,用于以直观和可理解的方式传达复杂的数据模式和关系。它们在数据分析中发挥着至关重要的作用,提供了通常难以从原始数据或传统数字表示中辨别出来的见解。 可视化对于理解复杂的数据模式和关系至关重要,我们将介绍11个最重要和必须知道的图表,...
-
美国码农疯狂求职,狂投250份简历!揭秘潜规则:网申填完就战胜92%对手
经济下行,科技行业各大公司降薪的降薪,裁员的裁员。 但是就业市场中最惨的却永远是那些还在找工作的人。 美国的一名软件工程师Shikhar Sachdev因为自己在找工作时被连续不断拒绝,却激发出了他不断尝试找各种工作的兴趣。 在他找到工作已经入职之后,...
-
清华新研究解密信息茧房!全新信息动力学理论,登Nature子刊
新一代信息与智能技术的迅猛发展推动着人类逐步迈入智能社会。在数字技术和智能推荐算法的加持下,媒体和平台越来越贴心,总是能最快最准的地契合人们的个性化偏好和需求。 然而,与此同时,智能精准推荐致使「信息茧房」现象不断发酵,观点相似的人群在网络空间组成团体,...
-
50张图“毒倒”Stable Diffusion,汽车和牛都分不清了
艺术家对AI侵权的反击来了—— 在画作里“投毒”,AI用了就会“中毒”出故障。 投毒工具由芝加哥大学团队打造,名为Nightshade,可以对画中像素添加隐形更改。 被下毒的画一旦被非法抓取成为训练数据被AI吃掉,模型就会生成混乱。 甚至还可能会破坏DA...
-
4K画质3D合成视频,渲染速度提升30多倍,论文作者带你解读新研究
来源:˃责任编辑:张燕妮 来源: 机器之心...
-
口型几乎完美、还能卡点,霉霉说地道中文的视频火了,背后AI工具原来是它
这两天,美国女歌星霉霉(泰勒・斯威夫特)一则说中文的短视频在各社交平台火了起来。有的播放量已经达到了 600 多万。 在视频里,霉霉操着一口流利、地道的中文,神情自若,几乎没有早期译制片女主角的那种腔调,口型也能对得上。 图源:微博 @会火 还没有看过...
-
你的GPU能跑Llama 2等大模型吗?用这个开源项目上手测一测
在算力为王的时代,你的 GPU 可以顺畅的运行大模型(LLM)吗? 对于这一问题,很多人都难以给出确切的回答,不知该如何计算 GPU 内存。因为查看 GPU 可以处理哪些 LLM 并不像查看模型大小那么容易,在推理期间(KV 缓存)模型会占用大量内存,例...
-
仅五个字符的新绘图语言火了,ChatGPT都学会了
只用五个字符,就能完成一幅像素画的绘制了。 这是一种新的绘图语言,一共支持8种颜色,画幅可达256*256。 它包含了“CFR[]”这五个符号,因此名字也就叫CFR[]了,主打的就是一个直观。 而且CFR[]免费开源,无需部署安装,在线就能体验。 虽然...
-
物流领域高效利用GenAI的关键是理解用例
虽然一开始可能并不清楚GenAI如何应用于主要运输货物的功能,但我们的研究指出了将GenAI功能应用于物流目标的机会。在采用时,不要让你的团队一头扎进GenAI试点,企业领导今天应该把他们的注意力集中在用例的构思和优先级上。 构思和优先顺序 首先,...
-
首个软件专利获得者离世,享年93岁,他为软件争得知识产权法保护
拥有世界上第一个软件专利的人,离世了。 他叫马丁·格茨(Martin Alvin Goetz),被誉为“第三方软件之父”。 他将软件从硬件“捆绑销售”的状态中解放出来,并创办了第一家软件产品公司,开发出第一个商业软件产品。 曾经不受任何知识产权法保护的软...
-
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界...
-
AI设计工具Stockimg.ai 可生成海报、徽标等高质量素材图片
Stockimg AI 是一款基于人工智能技术的图片生成工具,旨在为团队提供便捷的设计解决方案。无论是需要生成 AI 徽标、AI 书籍封面、AI 海报等,Stockimg AI 都能轻松满足您的需求。节省时间和金钱,提高设计流程效率。 通过 Stockim...
-
AI算法可检测针对军用无人驾驶车辆的中间人攻击
研究人员研发的人工智能算法,可检测到针对军用无人驾驶车辆的中间人攻击。 机器人操作系统(ROS)是高度网络化的,机器人之间需要协作,其中的传感器、控制器等需要通信并通过云服务交换信息,因此极易受到数据泄露和电磁劫持攻击等网络攻击。中间人攻击(MitM)是...
-
免费开源AI视频工具VideoCrafter:输入文本轻松生成高质量视频
VideoCrafter是一款全新的开源视频创建和编辑套件,采用了扩散模型,能够从文本描述生成照片和视频逼真的输出。 尽管尚未正式发布,但VideoCrafter有望显著改变视频制作流程。使用VideoCrafter,即使没有视频编辑或动画经验的人也可以轻...
-
OpenAI高管称AI将在10年内能胜任任何工作
OpenAI的首席执行官Sam Altman和首席技术官Mira Murati在华尔街日报的WSJ Tech Live大会上表示,人工智能(AI)预计将在未来的10年内具备胜任人类可以做的任何工作的能力。这一觏模称为“人工通用智能”(AGI ,并将改变工作...
-
沃尔玛利用AI进行创新的实战经验
沃尔玛创始人山姆·沃尔顿经常说的一句话是:“我们的人让一切不同”,这句话仍然指引着沃尔玛在利用AIGC进入未来的道路。 这家跨国零售公司将自己定位为一家“以人为本、以科技为动力”的公司,而位于这一交叉点的正是AIGC,大多数领导者认为,当人和技术的力量结...
-
新加坡华侨银行面向全球员工推出生成式AI聊天机器人
新加坡华侨银行(OCBC)成为新加坡首家将生成式AI聊天机器人引入全球员工的银行。根据官方声明,OCBC将在2023年11月向其全球30,000名员工提供生成式人工智能(AI 聊天机器人,这将使其成为新加坡首家实现此目标的银行。 这款聊天机器人是与微软的...
-
Meta普林斯顿提出LLM上下文终极解决方案!让模型化身自主智能体,自行读取上下文节点树
到底什么才是LLM长上下文模型的终极解决方案? 最近由普林斯顿大学和Meta AI的研究者提出了一种解决方案,将LLM视为一个交互式智能体,让它决定如何通过迭代提示来读取文本。 论文地址:https://arxiv.org/abs/2310.05029...
-
AI视野:星火大模型V3.0发布;B站测试推出“AI视频总结”功能;高通发布骁龙8Gen3;苹果计划每年砸10亿美元搞AI
????大模型动态 科大讯飞星火认知大模型V3.0正式发布 在今日的2023科大讯飞全球1024开发者节上,科大讯飞宣布,讯飞星火认知大模型V3.0正式发布,目前星火大模型已整体超越ChatGPT。 ???AI应用 B站测试推出“AI视频总结”功能 近日...
-
GPT-4教会机器手转笔、玩魔方!RL社区震惊:LLM设计奖励竟能超越人类?
GPT-4,竟然教会机器人转笔了! 图片 英伟达、宾大、加州理工、德州奥斯汀等机构的专家提出一个开放式Agent——Eureka,它是一个开放式Agent,为超人类水平的机器人灵巧性设计了奖励功能。 图片 论文链接:https://arxiv.org/p...
-
比尔·盖茨对 GPT-5没有太高期望
尽管 OpenAI 预测其下一代语言模型 GPT-5将比当前版本 GPT-4有显著改进,但微软联合创始人比尔·盖茨对此表示怀疑。 在接受德国商业报纸《商报》采访时,盖茨表示他不认为 GPT-5会比 GPT-4好很多。他引用了从 GPT-2到 GPT-4的质...
-
科技界“教父”表示:对AI公司造成的伤害必须追究责任
包括两位“科技教父”在内的资深专家警告称,强大的人工智能系统威胁社会稳定,AI公司必须对其产品造成的危害承担责任。这一警告是在国际政界、科技公司、学术界和社会公众为下周在Bletchley Park举行的AI安全峰会做准备之际发出的。 23位专家共同起草了...
-
虹软科技推出PhotoStudio® AI 几秒生成高清商拍大片
随着电商市场的竞争日益激烈,商拍图的质量和效率成为了影响商品销售的重要因素。然而,传统的商拍方式存在着流程繁琐、周期漫长、效果受限、费用高昂等诸多问题,给商家带来了不少困扰。为了解决这些问题,虹软科技在今天推出了一款面向电商的创新产品——PhotoStud...
-
亚马逊重新聚焦无人机送货战略,工会组织对可能的裁员潮表示担忧
亚马逊(Amazon 日前发布了一系列新型无人机和机器人,并声称它们将帮助公司“交付未来”。但行业专家为此警告说,在自动配送和人工智能驱动的物流成为常态之前,亚马逊还需要突破基础设施及法律规章的限制。同时,亚马逊也需要注意机器代人后引发的裁员潮问题。...