-
GPT-4/Gemini大翻车,做旅行攻略成功率≈0%!复旦OSU等华人团队:Agent不会复杂任务规划
AI智能体,是目前学界炙手可热的前沿话题,被众多专家视为大模型发展的下一个方向。 然而,最近复旦、俄亥俄州立大学、宾夕法尼亚州立大学、Meta AI的研究者们发现,AI智能体在现实世界的规划能力还很差。 他们对GPT-4 Turbo、Gemini Pro...
-
AIGC在物联网与智能制造中的实践
1.背景介绍 1. 背景介绍 物联网和智能制造是当今最热门的技术领域之一,它们在各种行业中发挥着重要作用。随着计算机视觉、自然语言处理和机器学习等技术的发展,人工智能(AIGC 在物联网和智能制造领域的应用也日益增多。本文将探讨AIGC在物联...
-
无需GPU,手机芯片也能运行多模态模型!面壁智能发布MiniCPM,性能超过Mistral-7B!
2月1日,面壁智能发布了旗舰端侧模型 MiniCPM,它以小博大的性能超越了 Mistral-7B,并在 MT-Bench 等榜单上表现出色。 MiniCPM 是一款能说会看、具备编程能力、拥有多模态能力的端侧模型。它不仅在性能上优秀,而且具有极低的成本...
-
打破MoE训练效率与性能瓶颈,华为盘古稀疏大模型全新架构LocMoE出炉
2023 年 12 月,首个开源 MoE 大模型 Mixtral 8×7B 发布,在多种基准测试中,其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B,而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能,稠密 LLM 常由于其参数...
-
大模型没有护城河?OpenAI的“LLM城池”如何攻破,如何防守
作者 | Ben Dickson 译者 | 李睿 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 小模型、开源模型正在猛攻GPT-4,OpenAI需要更完善的措施来构建技术方面的护城河,以保护其LLM业务。 2023年5月,...
-
IBM研究发现: AI语音克隆可劫持合法通话进行诈骗
近期,IBM研究人员发现了一种相对简单的方法,可以利用生成式AI工具劫持语音通话。这一发现引发了对金融机构等依赖电话验证身份的组织的担忧。利用低成本的AI工具,骗子们现在可以轻松地冒充他人的声音,劫持正在进行的对话,以窃取资金和其他敏感信息。 图源备注:...
-
【Stable Diffusion】通过ControlNet修复手臂
ControlNet用处 ControlNet是一个用于机器人控制的高度模块化的、灵活的开源框架,它支持各种传感器、执行器和通信协议。ControlNet可以用于各种应用领域,包括但不限于: 工业自动化:ControlNet可以用于工业自动化系统...
-
国产短剧出海用AI换脸变外国人:至少降低20%成本
快科技1月31日消息,据媒体报道,目前不少国产短剧为了出海找到了以低成本获得高回报的新思路使用AI将华人演员的面孔替换为外国演员的模样。 据了解,在国内制作一部短剧需要50万元到70万元的成本,而在海外,制作成本将会达到100万元到150万元左右,甚至高出...
-
讯飞星火V3.5整体接近GPT-4 Turbo!首个13B开源大模型发布,深度适配国产算力
【新智元导读】首个基于全国产化算力平台「飞星一号」的大模型,正式开源! 1月26日,美国商务部长雷蒙多表示,拜登政府正在尽全力阻止中国获得训练AI模型所需的算力资源。 美国的云计算公司,都被要求确定是否有外国实体正在访问美国数据中心以训练AI模型。 雷蒙多...
-
基于参考物体的AIGC图像生成技术在家居导购领域的应用
本文深入探讨了基于参考物体的人工智能图像生成(AIGC)技术的最新进展。首先概述了该类技术如何发展至今,然后着重分析了两篇重要的相关学术论文。随后,文章针对家居导购领域的特殊应用场景,讨论了运用此项技术时遭遇的挑战和取得的最新效果。...
-
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
比斯坦福炒虾机器人还厉害的机器人来了! 最近,CMU的研究者只花费2.5万美元,就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。 论文地址:https://arxiv.org/abs/2401.14403 厉害之处就在于,它是完全自主完成操作...
-
人工智能和机器学习在物联网中的作用有哪些
将人工智能(AI 和机器学习(ML 集成到物联网(IoT 系统中,标志着智能技术发展的革命性一步。这种融合通常被称为AIoT(物联网人工智能 ,不仅是能力的增强,而且是物联网系统如何运行、学习和适应环境的根本转变。让我们来探讨一下这种集成及其含义。 人...
-
AIGC——使用Cursor对比直接使用chatGPT有哪些技巧
Cursor等chatGPT相关工具的那些用法 1. 聊聊it团队经常面临的问题 2. 试想一些AI辅助的应用场景 3. 看回现实可用的工具及其使用 3.1 加载文件作为对话上下文 3.2 源码工程辅助阅读 3.3 批量文件式输入口 3.4...
-
AI速配官网体验入口 人工智能图片一键生成工具软件在线使用地址
AI速配是一款智能图片生成利器,提供背景融合、一键抠图、高清处理、涂抹消除、尺寸扩展等功能。以低成本和高质量满足您的图片生成需求。定位为满足个人和商业用户的图像处理工具。 点击前往AI速配体验入口 AI速配适用人群 AI速配适用于个人图片创作、美工设计...
-
2023年传媒行业中期策略 AIGC从三个不同层次为内容产业赋能
基本面和新题材共振,推动传媒互联网行情上涨 AIGC 概念带动,传媒板块领涨 A 股 2023 年第一个交易日(1 月 3 日)至 6 月 2 日,申万传媒指数区间涨幅高达 48.38%,同时期沪深 300 跌幅为 0.25%,传媒板块行情大幅领先大盘...
-
OpenAI创始人想打造全球芯片工厂网络 设计制造一把抓以对抗英伟达
OpenAI联合创始人Sam Altman最近提出一个设想,他想在全球打造AI芯片工厂网络,以对抗英伟达。 为了训练大语言模型,AI企业需要采购大量英伟达GPU,耗资不菲。当模型正常运营,向消费者开放,运营费用更是天文数字。 如何降低成本?大企业绞尽脑...
-
生成式人工智能如何推动智能自动化
1997年,世界见证了国际象棋卫冕冠军加里·卡斯帕罗夫(GarryKasparov 与IBM深蓝人工智能(DeepBlueAI 之间的一场开创性的对决。深蓝的巨大胜利标志着范式的转变,表明人工智能不仅仅是一种科学好奇心,而且是一种能够挑战人类智力的力量...
-
100天,3个版本,他们让营销AIGC起来了
“18权益加磅,省的不止一点点!”打开京东金融APP,一则热闹的营销头图跃入眼帘,你可能意识不到,这则堪比设计师水准的物料源自大模型的手笔。今年6.18和11.11,京东金融超过30%的资源位营销素材由AIGC自动生成,这一水平在亿级用户量的应...
-
AIGC带来的产业投资机会:全球视角下的产业洞察
AIGC (AI生成内容),是指利用人工智能技术生成各种形式的内容,如文本、图像、音频、视频,典型应用如ChatGPT、Midjourney等。AIGC技术在近年来得到了飞速的发展,为各个领域带来了巨大的变革和价值。与此同时,AIGC技术也催生了全球范围内...
-
2024年爆火视频制作SAAS开源系统--可生成AI告白/新年祝福/宣传片等!
为什么我们要做一个这样的产品? 最近一段时间,经常可以看到一些直播间,通过直播播放夸张的表白、生日祝福、豪车祝福等视频,从而获取了大量的人气。然后再通过引导粉丝刷礼物就可以制定专属视频来实现变现,直播间流量非常好做,停留很高,转化成交率高达百分之九十! 当...
-
业内:过去数月老款AI芯片降价,大模型培训成本降60%
1月24日消息,众所周知,开发大语言模型(LLM)成本高昂。这不仅包括模型本身的研发,还有在云端运行这些模型的费用。以人工智能初创公司Anthropic为例,云端运行模型的成本几乎占了该公司上个月收入的一半以上,这还未算上训练模型的成本。 然而,最近的...
-
推进智慧城市:多连接设备和人工智能的重要作用
随着互联设备的快速普及,智慧城市的概念正变得越来越接近现实。这些技术先进的城市中心有望通过错综复杂的互联设备网络提高居民的生活质量,并优化城市管理者的运营效率。从智能照明和电动汽车(EV 充电器到智能电表,这些设备具有巨大的潜力,可以彻底改变城市生活。...
-
Creatosaurus官网体验入口 AI创意营销平台在线使用地址
Creatosaurus是一款AI创意营销平台,提供全方位的社交媒体营销工具。它包括图形设计编辑器、生成式AI工具包、社交媒体管理、社交收件箱和分析等功能。该平台帮助用户提高社交媒体营销效率,降低成本,并提供全面的数据分析。定价灵活,适用于个人创作者到企业...
-
AI计算如何助推800G光模块发展?
...
-
纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了
人类有两只眼睛来估计视觉环境的深度信息,但机器人和 VR 头社等设备却往往没有这样的「配置」,往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称为单目深度估计(MDE)。 近日,一种可有效利用大规模无标注图像的新 MDE 模型 Depth Any...
-
逆天了!UniVision:BEV检测和Occupancy联合统一框架,双任务SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处,但在特征表示、数据格式和目标方面仍存在差距,这对统一高效的3D感知...
-
针对特定领域较小的语言模型是否与较大的模型同样有效?
经过2023年的发展,大语言模型展示出了非常大的潜力,训练越来越大的模型成为有效性评估的一个关键指标,论文《A Comparative Analysis of Fine-Tuned LLMs and Few-Shot Learning of LLMs f...
-
企业如何安全地找到实用的GenAI用例
AI,特别是GenAI和大型语言模型,已经在技术上取得了巨大的进步,并正在到达行业广泛采用的拐点。麦肯锡的报告称,AI领域的佼佼者已经在“全力以赴”,企业知道,他们必须接受最新的AI技术,否则就会被甩在后面。 然而,AI安全领域仍然不成熟,这给使用该技...
-
智慧城市:将技术融入城市生活
当我们深入探索这一迷人的旅程时,将探索物联网(IoT 、智能交通系统和节能建筑如何不仅仅是概念,而是塑造城市未来的积极元素。本文旨在了解技术与城市生活的无缝融合,使城市更高效,更宜居。 物联网在城市规划中的作用 物联网(IoT 是智慧城市革命的核心。其...
-
GPT-5被5万张H100卡脖子!Altman急筹数十亿美元,欲取代英伟达建起AI芯片帝国
Sam Altman正在筹集数十亿美元,建立一个全球性的半导体晶圆厂网络! 这一事件背后的原因很可能就是,OpenAI已经无「芯」训练「GPT-5」了。 此前,据英国《金融时报》报道,OpenAI 正在开发一种新的AI模型,该模型将是 GPT-4 的「重...
-
商业生态重塑进行时,百度AIGC锚定确定性生意增长
AIGC浪潮席卷之下,品牌营销该如何乘风而上,在充满不确定性的未来中收获确定性新增量? 近日,首届「iBrandi Festival品创·全球品牌节」·论坛在京举行,众多行业嘉宾围绕“品牌力量Brand Power”展开深度探讨,百度品牌营销业务部负责人...
-
谷歌DeepMind联合创始人:AI在五年内或可独立创业
1月22日消息,谷歌人工智能部门DeepMind的联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)预测,未来五年内人工智能将能够独立创建和经营公司。 在2024年世界经济论坛的一场人工智能专题讨论中,苏莱曼被问及:人工智能需要多长时间才能...
-
人工智能革命:共同探索AIGC时代的未来
一、引言 随着大数据和强大的计算能力的兴起,人工智能技术(AI)正在快速发展,并为各个领域带来革命性的变化。人工智能与智能计算技术(AIGC)的融合不仅为企业、科研机构和普通用户提供了巨大的机遇,也带来了一系列新的挑战。本文将探讨AIGC的应用领域,...
-
【AIGC科技展望】预测AIGC2025年的机会与挑战
2025年,AIGC的机会与挑战 在未来的五年里,AIGC(AI Generated Content)将会成为一个越来越重要的领域。但是,伴随着机会而来的是挑战。在这篇文章中,我们将一起探讨AIGC的机会与挑战,并预测2025年的前景。你会了解到AIG...
-
腾讯云AI绘画:探究AI创意与技术的新边界
目录 一、2023的“网红词汇”——AI绘画 二、智能文生图 1、智能文生图的应用场景 2、风格和配置的多样性 3、输入一段话,腾讯云AI绘画给你生成一张图 4、文本描述生成图像,惊艳全场 三、智能图生图:重新定义图像美学 1、智能图生图...
-
AI视野:谷歌推几何模型Alpha Geometry;三星发布AI手机Galaxy S24;Runway更新运动笔刷功能;Midjourney v6下周补齐缩放平移等功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📈💻💡大模型动态 谷歌推数学几何...
-
GPT-4,大增长时代的序幕
作者|成诚 虽然我们早在 2017 年就预测了超大模型的到来,因此才搞了分布式深度学习框架 OneFlow(github.com/Oneflow-Inc/oneflow/),且 2020 年的 GPT-3 也掀起了大模型热潮(OneFlow...
-
让你的Pandas代码快得离谱的两个技巧
如果你曾经使用过Pandas处理表格数据,你可能会熟悉导入数据、清洗和转换的过程,然后将其用作模型的输入。然而,当你需要扩展和将代码投入生产时,你的Pandas管道很可能开始崩溃并运行缓慢。在这篇文章中,笔者将分享2个技巧,帮助你让Pandas代码快得离...
-
几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型
在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体3D模型非常重要。 传统的方法创建这些模型不仅需要大量时间,还需要能够捕捉多视角照片的专业设备,此外还依赖于技术熟练的专业人员。 与此相反,在日常生活中,我们最常见...
-
埃森哲强调生成式人工智能是商业的关键颠覆者
根据埃森哲在达沃斯世界经济论坛年会之前发布的《2024变化脉搏指数》,商业领袖们在2023年经历了前所未有的变化速度,预计2024年将进一步加速。 新的年度指数利用一系列关键商业指标,如劳动生产率和IT支出,对影响商业变化的六个因素——技术、人才、经济...
-
沃达丰与微软签署10年战略合作 为超过3亿企业和消费者提供生成式AI等服务
沃达丰和微软于周二宣布建立一项新的、广泛的为期10年的战略合作伙伴关系,充分发挥各自优势,为欧洲和非洲的3亿多家企业、公共部门组织和消费者提供数字平台。 通过这一战略合作,双方将合作推动沃达丰的数字转型,运用微软的生成式人工智能,扩展沃达丰的物联网连接平台...
-
91%企业AI领袖相信生成式AI能提升效率
在最新的Deloitte调查中,对2,835名涉足生成式AI的企业高管进行了全面调研。结果显示,62%的受访者对生成式AI表现出热情,但有30%的人仍存在一定程度的不确定性。 调查发现,高管们相信生成式AI将在未来三年内对他们的公司和行业带来重大变革,其中...
-
不是人才用不起,而是AI巡检更有性价比!
作者 | 涂承烨 审校 | 重楼 在许多行业中,如煤炭、电力、化工等,安全生产是至关重要的。这就需要通过巡检,对设备运行状态进行实时监测,及时发现并处理潜在的安全隐患,从而降低事故发生的概率。但是传统的巡检方式通常依赖于人工进行,如纸质记录、手工录入等。...
-
AnimateDiff论文解读-基于Stable Diffusion文生图模型生成动画
文章目录 1. 摘要 2. 引言 3. 算法 3.1 Preliminaries 3.2. Personalized Animation 3.3 Motion Modeling Module 4. 实验 5.限制 6. 结论 论文:...
-
新型AI架构AGI-Samantha 可模拟人类大脑思考和自主交流能力
AGI-Samantha是一种新型的AI架构,利用多个LLM联动来模拟人类的大脑思考、记忆、感知和自主交流能力。它能够根据周围环境和情境自主决定何时进行交流对话,并拥有一种特殊的记忆系统,能够根据情境的相关性选择存储和回忆信息,并根据这些进行自我迭代进化。...
-
Raia官网体验入口 AI团队构建与自动化工具免费使用地址
Raia是一个先进的AI工具,专注于构建基于人工智能的团队,提高工作效率和战略决策能力。它具备学习和执行任务的能力,能够在不同行业和应用场景中发挥重要作用,同时帮助团队降低成本、加快工作进度,并提供深入的洞察和策略建议。 点击前往Raia官网体验入口 谁...
-
什么是AIGC技术
# 什么是AIGC技术 AIGC,全称为“人工智能生成内容”(Artificial Intelligence Generated Content ,指的是利用人工智能技术自动生成具有特定规则的文字、图像、音频和视频等多种类型的内容。这技术通常基于机器学习...
-
Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%
近日,国产开源项目SwiftInfer实现了无限流式输入推理,成功提升了大模型推理性能46%。这是一个重大突破,可以为多轮对话场景提供高效可靠的落地方案。 它采用了attention sink注意力机制、窗口注意力优化、KV Cache机制优化等方法,Sw...
-
400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低
22倍加速还不够,再来提升46%,而且方法直接开源! 这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 StreamingLLM可以在不牺牲生成效果、推理速度的前提下,实现多轮对话共400万个token,22.2倍推理速度提升。 该项...
-
大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制
在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工Guangxuan Xiao等人推出的StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共400万个token的流式输入,22.2倍的推理速度提升...