-
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
【新智元导读】斯坦福炒虾机器人作者,又出新作了!通过模仿学习,达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是,以上动作全部都是它自主完成的。 斯坦福炒虾机器人作者,又出新作了。 这次,机器人不是给我们炒饭了,而是给我们做外科手...
-
马斯克梭哈xAI,叫板OpenAI
历时四个月,全球最大超级计算中心“Supercluster”正式开始运转。 埃隆·马斯克在社交平台公开宣布,美国时间7月22日凌晨4:20,由xAI、X和英伟达等合力打造的“Supercluster”已开始投入训练。它由10万块H100组成,是目前世界上最...
-
深圳一小区推出付费共享电梯:通过AI识别技术实现自动扣费
深圳市罗湖区南湖街道新南社区东乐宿舍的居民最近告别了“爬楼时代”,小区新安装了两部共享电梯。这种共享电梯模式不同于传统电梯安装,居民无需承担高额的安装费用,而是根据使用情况按次支付0.2元至0.8元不等的费用,通过AI识别技术实现自动扣费。 目前,电梯处于...
-
GPT-4和Whisper从长视频生成短视频;AI治好了我的拖延症;GraphRAG技术集成到Open WebUI;两个开源LivePortrait实现
✨ 1: AI Youtube Shorts Generator AI Youtube Shorts Generator是一款利用GPT-4和Whisper从长视频生成短视频的Python工具。 AI YouTube Shorts Gene...
-
中国电信首款自主品牌AI手机终端—麦芒30 5G正式发布,让智能触手可及
2024年7月18日,“超续航、巨抗造、真臻彩” 麦芒史上最强手机——麦芒30 5G正式发布,新机延续了麦芒系列超能续航、可靠品质的强大基因,更在AI智慧、便捷体验、至臻大屏、美学设计等方面持续进阶,为用户带来科技与时尚兼具的绝妙体验。 作为中国电信首款自...
-
半小时教你手搓AI视频通话,还有懒人版代码已开源
GPT-4o的“AI视频通话”一鸽再鸽,但网友却是急不可耐想要体验。 于是,一位名叫Santiago(我们叫他三哥)的博主,用160行Python代码尝试了复刻。 虽然技术路线和《Her》有所差别,但从直观效果来看,也算得上是给网友们带来了新的玩具。 而...
-
配备国产6nm 5G芯片!中兴小鲜60手机曝光:还有内置AI大模型
快科技7月7日消息,中兴通讯即将推出的小鲜60手机已在中国电信终端产品库中曝光,这款手机搭载了紫光展锐T760 5G处理器,这是一款使用6nm工艺制造的国产芯片, 具备4个2.2GHz Cortex-A76核心和4个Crotex-A55核心,配备以及Mai...
-
红魔9S Pro AI游戏手机、红魔游戏本等多款旗舰新品即将亮相
据红魔手机官方消息,红魔将于7月3日晚上19点举办一场盛大的新品发布会。在此次发布会上,多款旗舰级产品将正式亮相,包括红魔9S Pro AI游戏手机、红魔游戏本、红魔冰域机械键盘、红魔魔镜QD-OLED 电竞显示器(32 英寸)、红魔散热器5 Pro、氘锋...
-
AI日报:文本转语音模型Fish Speech;Meta 3D Gen发布,1分钟快速构建3D模型;AI生成熊猫吃泡面视频刷屏抖音
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、可以媲美GPT-SoVITS的...
-
支付宝“AI陪诊师”上岗:美女AI护士全天候陪你看病
快科技6月30日消息,日前,上海市第一人民医院宣布通过支付宝AI就医助理”解决方案,以大模型、数字人等技术为基础,为患者提供交互陪伴式就医服务。 她就是上海首个基于大模型的语音交互的AI陪诊师-公济小壹”。只需要张张嘴,或者问一问我下一步要干嘛”,就可以获...
-
Niantic利用Meta Llama让数字生物栩栩如生
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同...
-
尝到AI甜头 Meta重组Reality Labs
Reality Labs的持续亏损让Meta的元宇宙之路走得比SpaceX “登火星”还难,大刀阔斧的改革还在继续。 近日,Meta宣布对负责元宇宙和虚拟现实业务的Reality Labs重大重组,将其拆分为“元宇宙”和“可穿戴设备”业务两个部门。未来的规...
-
联想moto razr 50 Ultra AI元启版发布 售价5699元起
联想在6月25日的AI终端“一体多端”战略暨消费新品夏季发布会上,正式推出了moto razr50系列折叠屏手机。这个系列包括了moto razr50Ultra AI元启版和moto razr50两款手机,起始售价为3699元。两款手机都支持IPX8级别的...
-
AI绘画专栏之statble diffusion SDXL 1.0 更加精细的OpenPose DW Openpose(23)
更为精细的DW openpose https://pan.quark.cn/s/8e66ada8a434 SD启动器2024最新版本下载 链接:https://pan.quark.cn/s/eea6375642fd 百度网盘复制到vx打开: #小程序:...
-
华为云盘古大模型5.0发布:可控时空生成技术重塑自动驾驶开发
快科技6月21日消息,在今日召开的华为开发者大会(HDC 2024 上,华为云发布了盘古大模型5.0,其创新的多模态生成能力,可以为自动驾驶领域提供更高质量的数据支持。 华为常务董事、华为云CEO张平安表示,盘古5.0通过创新的可控时空生成,大规模的生成和...
-
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
AIGC技术引领虚拟数字人革命:从制作到应用的全景解析 一、AIGC技术为虚拟数字人注入智能灵魂 二、AIGC型虚拟人制作流程实例分析 1、采集数据 2、建模 3、内容生成 三、AIGC在虚拟数字人应用中的案例分析 四、总结与展望...
-
Runway正式发布全新Gen3模型,AI视频的王,它回来了。
在AI视频被一众新秀,比如Sora、Luma、可灵等等占据注意力的时候,已经有人忘了AI视频领域统治了N久的王者,他叫Runway。 去年的11月份更新了一次Gen2模型模型,然后宣布他们要开始组团队开始进军世界模型之后。 他们就再无动静了。 一晃眼,将...
-
Hinton为拒马斯克offer扯谎挂电话,警告AI取代人类比想象中快30年
Geoffrey Hinton老爷子——图灵奖得主、深度学习发明人、AI三巨头、Ilya之师,在最新专访中透露出这个令人心碎的消息。 就在这两天,Hinton接受了多家媒体的专访,既有老生常谈的内容,即他对AI发展安全的担忧;也有一些新的话题和八卦。 他提...
-
AI绘画Stable Diffusion SDXL 超赞!高质量万能大模型,写实人像、时尚设计、建筑设计、电影制作—筑梦工业XLV4.0
大家好,我是阿威 今天为大家带来了一款多功能大模型——Dream Tech XL | 筑梦工业XL V4.0。该模型是大佬Dr_Dream基于V3.0训练而来的迭代版本,在提升画面质感的同时,对于提示词理解能力有跨越式提升,可以做到100%还原提示词。...
-
机圈周报:华为鸿蒙HarmonyOS首超苹果iOS 苹果发布自家AI技术
机圈周报,盘点一周新机、配置曝光、机圈热闻,每周更新,欢迎关注。 本周手机圈最大的热点,莫过于苹果WWDC24带来的iOS 18更新,以及自家AI技术Apple Intelligence了,我们这周的机圈周报也会多花一点篇幅讲讲有意思的新功能、新玩法,快来...
-
聊聊各种“GC”:UGC、PGC、PUGC、OGC、MGC、BGC、AIGC有什么区别?
01. UGC UGC(User Generated Content ,指用户原创内容。 UGC的概念最早起源于互联网领域,即用户将自己原创的内容通过互联网平台进行展示。 内容生产的主体是非专业人士,即一般公众;内容的制作渠道是非专业化的;内容...
-
盘点GPT-4o十大创意玩法!挑水果、看牙片、全自动化炒股,看完格局瞬间打开
自从OpenAI发布GPT-4o以来,“头号AI玩家”每天的状态be like:新语音模式上线了吗? 是的,还没有,但应该快了。 不过,毕竟GPT-4o已经上线半个月多,虽然新语音模式迟迟未来,但这不影响网友们用它整活儿。本期,“头号AI玩家”全方位盘点...
-
存储器在工业应用中采用人工智能的关键作用
人工智能(AI 已经大规模地出现在人们的视野中,这项技术正在从数据中心扩散到广泛的分布式位置,这是由更强大的处理器和更创新的算法实现的。但其他技术也需要跟上步伐,否则就有可能成为瓶颈。 美光科技公司工业部门主管David Henderson在接受行业...
-
微软震撼发布Copilot+PC!真正意义上的AIPC时代已经到来!
5月20日,微软正式发布了 Copilot+ PC,这是全球首款专为 AI 设计的 Windows PC,也是 有史以来最快、最安全、功能最强大的 Windows PC Copilot+ PC 内置了 OpenAI 的 GPT-4o...
-
柒瑞赛事自动采集器:革新体育赛事数据采集与处理
在现代体育赛事中,数据的采集与处理已经成为不可或缺的一环。随着科技的进步,传统手动采集赛事数据的方式已经无法满足高效、准确的需求。在这一背景下,“柒瑞赛事自动采集器”应运而生,凭借其自动化、智能化的特点,为体育赛事行业带来了前所未有的变革。一、柒瑞赛事自动...
-
使用文心一言进行图像内容理解
接上篇文章,这期使用文心一言图像识别API,对本地图片以及在线视频图片进行内容理解。 该请求用于图像内容理解,支持输入图片和提问信息,可对输入图片进行理解,输出对图片的一句话描述,同时可针对图片内的主体/文字等进行检测与识别,支持返回图片内多主体/文字的...
-
百度文心大模型学习机“小度学习机Z30”发布
近日,百度旗下的小度科技正式推出了首款基于文心大模型的学习机Z30,已在京东平台全面开售。这款学习机以“重新定义AI老师”为核心理念,旨在通过先进的AI技术助力孩子主动学习,同时让家长享受全陪伴的超省心体验。其8GB RAM +256GB存储空间的版本售价...
-
全球首台生物计算机开放服务:16个人脑类器官,能耗节省百万倍
科幻小说《三体》中,为了支撑科技的发展,人类提出了几种下一代计算机的方案,其中除了传统的冯诺依曼架构,还包括量子计算机和生物计算机。其中量子计算的概念现在已有大量研究,生物计算的研究却少有报道。 近日,一家瑞士初创公司 FinalSpark 发布了全球首...
-
DiffMap:首个利用LDM来增强高精地图构建的网络
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文标题: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者: Peijin Jia, Tuo...
-
惊掉下巴:GPT-4o现场爆改代码看图导航!OpenAI曝光LLM路线图,GPT Next年底发
这几天,在巴黎举办的最大科技活动VivaTech上,OpenAI再次带来了许多惊喜。 从展示的模型智能进化路线图中,可以确定的是,今年OpenAI一定会发布新一代旗舰模型。 而且,大概率不会以GPT-5命名,演示中将其称之为「GPT Next」。 那么...
-
moto X50 Ultra今天开启预售!搭载骁龙8gen3的AI旗舰来了!
今天,摩托罗拉旗下moto X50 Ultra手机正式开启预售。这款手机搭载了骁龙8gen3处理器,并提供12 256GB、12 512GB和16 1TB三种存储配置可选,售价分别为3999元、4299元和4699元。 moto X50 Ultra采用了金...
-
桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o demo再次惊艳:“能力还是被低估了”
GPT-4o桌面端最新Demo,与Sora的新作品一同亮相“欧洲AI春晚”VivaTech。 现场,OpenAI工作人员不仅展示了观众期待已久的“视频通话”,还试着让ChatGPT发表了演讲。 在视频聊天当中,即使给它的只有一幅抽象的简笔画,它也能立马...
-
【GitHub】github学生认证,在vscode中使用copilot的教程
github学生认证并使用copilot教程 写在最前面 一.注册github账号 1.1、注册 1.2、完善你的profile 二、Github 学生认证 注意事项:不完善的说明 三、Copilot 四、在 Visual Studio C...
-
yolov部署到iPhone或终端实践全过程
本文经计算机视觉研究院公众号授权转载,转载请联系出处。 期待已久的检测经典又来来了一波强袭——yolov5。其实yolov5没有完整的文件,现在最重要的应该是把yolov4弄清楚,在目标检测领域中受益匪浅,可以在某些场景得到较高的提升。今天我们还是给大...
-
第一波收割完的 AI 创企要跑路了?6 年来仅做了一款产品,问世 30 天就彻底失败,Ai Pin 公司 10 亿美元求“卖身”
当地时间5月22日,据外媒报道,总部位于美国加州旧金山的可穿戴设备初创公司 Humane 正考虑接受收购。彭博社援引消息人士称,该公司的定价在7.5亿至10亿美元之间,出售过程正处于早期阶段。 1成立5年未公开过任何产品,拿着 PPT 融了10多亿元? 据...
-
AI 如何颠覆社交互动?两位 Snap 工程师做了这款表情包产品
“生成式 AI 技术正引领一场社交媒体自我表达的革命。从Remini的黏土滤镜到 Easel 的表情包,图像生成领域的创新产品不断涌现。生成式技术、社交媒体与自拍照的结合,为用户提供了前所未有的个性化和创意表达空间。“ Sense 思考 我们尝试基于文章内...
-
AI Pin 首次亮相后表现不佳 Humane 正在寻找买家
Humane,一家备受好评的AI Pin可穿戴电脑背后的初创公司,正为其业务寻找潜在买家。据报道,该公司由苹果前长期员工Imran Chaudhri和Bethany Bongiorno领导,目标售价在7.5亿至10亿美元之间。 售价699美元的AI Pin...
-
自动驾驶第一性之纯视觉静态重建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 纯视觉的标注方案,主要是利用视觉加上一些GPS、IMU和轮速计传感器的数据进行动静态标注。当然面向量产场景的话,不一定非要是纯视觉,有一些量产的车辆里面,会有像固态雷达(AT128)这样的传感器。如...
-
微软重新定义AI PC:与GPT-4o共享屏幕,看过的一切再也不会忘
今天,微软重新定义了个人电脑。 刚刚发布新一代Copilot+PC,让上市还没几天的第一批AI PC直接过时了。 在新一代PC里,打游戏时可与AI实时对话,提供吐槽陪玩或攻略指导,由GPT-4o提供支持。 任何文件或网页浏览记录都可以用自然语言搜索,轻...
-
走进数字时代:采集图片的艺术与科技
在数字化飞速发展的今天,图片采集已成为我们日常生活和工作中不可或缺的一部分。从拍摄美丽的风景照,到记录重要的历史时刻,再到科学研究中的数据分析,采集图片这一行为所蕴含的意义和内涵越来越丰富。接下来,就让我们一起走进这个充满魅力的领域,探索采集图片背后的艺术...
-
探秘采集机器人:未来科技引领智能数据采集新时代
随着科技的不断进步和发展,机器人技术也日益成为各行各业关注的焦点。在众多机器人类型中,采集机器人以其独特的功能和广泛的应用场景,逐渐成为智能数据采集领域的新宠。本文将从采集机器人的定义、技术特点、应用领域以及未来发展趋势等方面进行深入探讨,带领大家走进采集...
-
骁龙8 Gen3 AI旗舰!魅族21系列618特惠:3099元起
快科技5月16日消息,今天,魅族21系列618开启大促,魅族21到手3099元起,魅族21PRO到手4199元起。 核心配置方面,魅族21采用6.55英寸屏幕,搭载高通骁龙8Gen3平台,前置3200万像素,后置1300万像素超广角镜头,2亿像素广角主摄和...
-
花1块钱就有上万篇内容,新晋AI顶流把价格打下来了
过去几天,AI行业大事件高度密集。 先是OpenAI贴脸开大发布GPT-4o,而后谷歌I/O大会原地回击掏出华丽升级Gemini全家桶。放眼国内AI赛道,备受关注的则是字节终于高调发布豆包大模型家族。 昨天上午,当火山引擎总裁谭待宣布豆包通用模型推理输入价...
-
苹果将推出的AI补丁 用眼睛和声音控制您的 iPhone 和 iPad
苹果公司在纪念全球辅助功能意识日上宣布了即将推出的 iOS 和 iPadOS 辅助功能,旨在为残疾人士提供更便捷的体验。这些新技术不仅服务于特定群体,还可能对广大用户产生积极影响。 眼动追踪技术将成为 iPhone 和 iPad 用户的利器,无需额外硬件...
-
谷歌CEO:如果OpenAI在AI训练中滥用YouTube将采取行动
谷歌母公司 Alphabet 的 CEO Sundar Pichai 在接受 BC 采访时表示,如果谷歌发现由微软支持的 OpenAI 利用 YouTube 内容来训练能够生成视频的人工智模型,谷歌将采取行动来解决这个问题。 这一表态是在 OpenAI 技...
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...
-
基本就是AGI?GPT-4o“它”来了
OpenAI昨晚发布的GPT-4o给许多智能助理丢下一颗震撼弹。它不仅是一款强大的多模态AI助理,同时,为了应对Google Gemini的免费策略,OpenAI也让它免费了。 GPT-4o其中的“o”代表“Omni”,也就是“全能”的意思,可见Open...
-
GPT-4o实际应用案例:盲人可以更好地“看见”世界
OpenAI和Be My Eyes合作推出了一款新的APP,旨在帮助视力受限人群实时了解身边场景并提供帮助。这款APP利用了最新的GPT-4o模型,结合了实时视觉和语音能力。 通过这款APP,盲人可以随时了解自己周围的环境,并通过语音助手的帮助做出一些决策...
-
OpenAI春季发布会:这是“Moss”的诞生,我们人类究竟该何去何从
今天,OpenAI又又又又开发布会了。 在大众心里,现在也基本上都知道,奥特曼是一个贼能PR的人。 每一次的PR的时间点,都拿捏的极其到位,精准的狙击其他厂商。比如说上一次Sora,其实你会发现从头到尾就是一个PR的举动,2月16号发的,特么的快3个月了,...
-
OpenAI发布最新旗舰大模型GPT-4o:免费试用 价格五折速度提高一倍
GPT-4o具体特性一览: 站长之家(ChinaZ.com)5月14日 消息:今日凌晨,OpenAI发布了最新旗舰大模型GPT-4o。这款全能AI不仅免费可用,而且具备横跨听图片、看图片、说图片的多项能力,为用户带来如视频电话般丝滑流畅的交流体验。 O...