-
30 年首次改版,微软为 AI 对 PC 下手,在键盘上新增 Copilot 键
一键启动 Copilot 生成式 AI 助手 “全面拿下 AI”,如今的微软正在冲破软件的束缚,开始向硬件设备发起挑战。 1 月 4 日,微软带来最新消息:希望 2024 年能成为“AI PC 年”,于是,其为 Windows 11 电脑推出一个全新的...
-
从零手搓MoE大模型,大神级教程来了
传说中GPT-4的“致胜法宝”——MoE(混合专家)架构,自己也能手搓了! Hugging Face上有一位机器学习大神,分享了如何从头开始建立一套完整的MoE系统。 这个项目被作者叫做MakeMoE,详细讲述了从注意力构建到形成完整MoE模型的过程。...
-
Unbound官网体验入口 AI产品照片生成工具在线使用地址
Unbound– AI 产品照片 是一款利用人工智能生成逼真产品照片的工具。无论您是自动化在线业务、社交媒体、广告宣传还是其他场景的用户,Unbound都能满足您的需求。它可以在几秒钟内生成任何尺寸的产品照片,根据用户提供的透明图片生成无限多的专业产品照片...
-
比亚迪发布璇玑AI大模型;微软推出Copilot Pro;国内首个MoE模型上线
比亚迪发布璇玑 AI 大模型 1 月 16 日,在 2024 比亚迪梦想日活动上,比亚迪正式发布了整车智能化架构「璇玑」及「璇玑 AI 大模型」。 比亚迪产品规划及汽车新技术研究院院长杨冬生称,「璇玑」是行业首个智电融合的智能化架构,让汽车拥有...
-
AI时代来了,专业摄影师会被淘汰吗?
现在科技界几乎已经形成一种共识,即随着AI的进化,很多职位将会被替代,当中就包括专业摄影师。 Medium在报告中指出:“随着AI和图像处理技术的发展,摄影正在从高技巧创作变成了以技术驱动的创作。在技术的加持下,即使是普通用户,也可以拍出高质量影像,传...
-
LangGraph:构建智能对话的AI库,轻松打造复杂、有记忆的应用
在构建能够对用户输入做出响应、记住过去互动并基于历史做出决策的系统时,LangGraph库成为解决这一问题的关键工具。这一需求对于创建更像智能代理的应用至关重要,这些应用能够保持对话、记住先前的上下文,并做出明智的决策。 当前存在一些解决方案,它们可以部分...
-
360度无死角!UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作
输入一张任意姿势的照片,想让照片里的人跟随「指定视频」来进行动作模仿并不简单,除了肢体动作的模仿外,模型还需要对运动过程中衣服、人物外观的变化进行建模。 如果输入图像是正面的,而模仿的视频动作包括转身的话,模型还需要「想象」出衣服的背面样子,以及衣...
-
谷歌AI研究提出 SpatialVLM:一种数据合成和预训练机制,以增强视觉语言模型 VLM 空间推理能力
谷歌AI研究团队最近提出了SpatialVLM,这是一种旨在增强视觉语言模型(VLMs)空间推理能力的创新系统。 尽管先进的模型如GPT-4V在人工智能驱动任务中取得了显著进展,但它们在空间推理方面仍存在显著局限。空间推理涉及理解物体在三维空间中的位置以及...
-
AWS Iot Device Shadows
参考连接:AWS IoT Device Shadow 服务 - AWS IoT Core (amazon.com 1、 Device shadow基本概念 设备的影子是用于存储和检索设备的当前状态信息的 JSON 文档。(存储在AWS IOT c...
-
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
来了,贾扬清承诺的 Lepton Search 开源代码来了。 前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。 项目链接:https://github.com/le...
-
三星与百度合作,为Galaxy S24系列创造AI体验
三星在中国选择了一个合法的替代方案,即与百度AI Cloud展开合作。这一战略伙伴关系的宣布意味着三星电子中国和百度将共同创造一种AI体验,以提升三星Galaxy S24系列的功能。 在这次合作中,百度的文心一言基础模型将与Galaxy AI深度集成,为...
-
ChatGPT与文心一言:谁更胜一筹?
在人工智能领域,语言模型的发展日新月异,ChatGPT与文心一言作为市面上两款备受瞩目的AI助手,各自具有一定的优势。本文将从智能回复、语言准确性和知识库丰富度等方面,对这两大AI助手进行比较,以期为大家提供一些参考。 一、智能回复 在智能回复方面,C...
-
Meta官方的Prompt工程指南:Llama 2这样用更高效
Meta官方的Prompt工程指南:Llama 2这样用更高效...
-
通义千问视觉语言模型Qwen-VL在线体验入口 阿里云AI在线使用入口
Qwen-VL是阿里云推出的通用型视觉语言模型,具备强大的视觉理解和多模态推理能力。采用 Transformer 结构,以 7B 参数规模进行预训练,支持 448x448 分辨率,能够端到端处理图像与文本的多模态输入与输出。Qwen-VL在多个视觉基准测试...
-
人工智能和机器学习在物联网中的作用有哪些
将人工智能(AI 和机器学习(ML 集成到物联网(IoT 系统中,标志着智能技术发展的革命性一步。这种融合通常被称为AIoT(物联网人工智能 ,不仅是能力的增强,而且是物联网系统如何运行、学习和适应环境的根本转变。让我们来探讨一下这种集成及其含义。 人...
-
黑石集团正建造价值250亿美元的巨型AI数据中心
黑石集团正建造一个价值 250 亿美元的巨型数据中心。这家私募股权巨头称,数据中心可能是其有史以来最好的投资之一——但是,要实现增长,所需的资源是巨大的。 图源备注:图片由AI生成,图片授权服务商Midjourney 该数据中心将建在美国凤凰城的一条高速...
-
AI在工业物联网(IIoT)中的安全管理与应用
作者 | 陈峻 审校 | 重楼 在开放的工业互联网环境中,数百万个基于物联网的终端和中间设备,需要全天候地持续通信并保持在线状态。不过,这些设备往往由于最初设计上的限制,在机密性、完整性、可用性、扩展性、以及互操作性上,存在着各种安全漏洞与隐患。与此同时...
-
福原爱首场直播带货额不足2.5万元 AI「直播带货」应用有哪些?
关于福原爱首场直播带货不足2. 5 万元的消息引发了人们对于明星带货直播的关注。在这场直播中,福原爱展示了 24 件商品,包括日常用品如龙年红包、纸巾、牙刷、手机壳装饰、洗衣凝珠等,但观看人次仅有74. 2 万,峰值在线人数1. 9 万,平均在线人数刚刚超...
-
检测路在何方?YOLOv8终极指南
本文经自动驾驶之心公众号授权转载,转载请联系出处。 YOLOv8是计算机视觉领域的最新发展,它是一种用于目标检测、实例分割和分类的最新先进模型。除了对模型架构本身的改进之外,YOLOv8通过一个用于使用YOLO模型的PIP包为开发者提供了一个新的友好界...
-
谷歌AI芯片TPU v5p在训练LLM方面比其前一代快2.8倍
谷歌正迅速成为其最好的朋友英伟达的强大对手——其超级计算机所使用的TPU v5p人工智能芯片比以往任何时候都更快、更大、更宽,甚至超过了强大的H100。谷歌在最近推出其Gemini人工智能模型的同时,也发布了其最新版本的旗舰张量处理单元(TPU),用于人工...
-
最新国内可用GPT4、Midjourney绘画、DALL-E3文生图模型教程
一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画,文档对话总结+DALL-E3文生图,相信对大家应该不感到陌生吧?简单来说,GPT-4技术比之前的GPT-3.5相对来说更加智能,会根据用户的要求生成多种内容甚至也可以...
-
谷歌云与Hugging Face签署人工智能基础设施合作协议
谷歌公司(Google LLC)云计算部门今天宣布与Hugging Face公司建立新的合作伙伴关系,后者是一个流行的共享开源人工智能模型平台运营商。 根据协议,谷歌云将成为Hugging Face人工智能训练和推理工作负载的 “首选目的地”。此外,两...
-
大模型开山鼻祖!InstructGPT发布两周年了
今天是InstructGPT发布两周年的纪念日,它是现代大语言模型的开山鼻祖。Jim Fan介绍了InstructGPT的重要性并且说了几条关于InstructGPT非常有意思的点。还展示了InstructGPT中非常经典的三步LLM训练方法的图片,我也顺...
-
探索【Stable-Diffusion WEBUI】的图片超分辨插件:StableSR
文章目录 (零)前言 (一)图片放大 (二)图片超分辨率放大脚本插件(StableSR) (2.1)下载组件 (2.2)使用 (2.3)实例对比(放大) (2.4)实例对比(修复) (三)总结 (零)前言 本篇主要介绍W...
-
ADMap:用于重建在线矢量化高精地图的抗干扰框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://arxiv.org/pdf/2401.13172.pdf 代码链接:https://github.com/hht1996ok/ADMap 摘要 本文介绍了ADMap:用...
-
OpenAI最新功能:多GPTs协同工作 @谁,谁出来干活
OpenAI最新推出的功能引起了广泛关注,该功能允许用户在对话中@不同的GPT,实现多个GPT协同配合完成任务。这一改动可能带来的影响是巨大的,人们使用AI的工作流程可能就此改变,人们自己的工作方式也可能就此改变。 这一功能使得使用GPT的方式更加中心化,...
-
未来五年AI如何改变各学科?从LLM到AI蛋白设计、医疗保健......
五年前(2019 年 1 月),《Nature Machine Intelligence》创刊。当然,就人工智能(AI)而言,五年前似乎是一个不同的时代。 1 月 24 日,Nature Machine Intelligence 杂志在《Annivers...
-
ChatGPT惊艳更新,一个@让三百万GPTs为你打工
ChatGPT悄悄更新个大功能!看起来要把插件系统迭代掉了。 部分(灰度)用户已经收到这样的提示: 现在可以在对话中@任意GPT商店里的GPTs,就像在群聊中@一个人。 体验到的博主Dan Shipper第一时间录视频激动地分享:一个改变游戏规则的功能。...
-
AIGC内容分享(五十八):AIGC数据跨境的法律监管和合规路径
目录 一、引言 二、AIGC数据出境主要场景分析 三、数据出境法律监管和合规路径 四、对AIGC数据出境的合规建议 一、引言 在生成式人工智能(Generative AI,下称“AIGC”)技术的发展和应用过程中,相关法律监管问题一直备受...
-
RAG高阶技巧-如何实现窗口上下文检索
在本文中,我们将介绍一种提高RAG(Retrieval-Augmented Generation)模型检索效果的高阶技巧,即窗口上下文检索。我们将首先回顾一下基础RAG的检索流程和存在的问题,然后介绍窗口上下文检索的原理和实现方法,最后通过一个实例展...
-
LLaMA Efficient Tuning
文章目录 LLaMA Efficient Tuning 安装 数据准备 浏览器一体化界面 单 GPU 训练 train_bash 1、预训练 pt 2、指令监督微调 sft 3、奖励模型训练 rm 4、PPO 训练 ppo 5、DPO 训练...
-
LLM巫师,代码预训练是魔杖!UIUC华人团队揭秘代码数据三大好处
大模型时代的语言模型(LLM)不仅在尺寸上变得更大了,而且训练数据也同时包含了自然语言和形式语言(代码)。 作为人类和计算机之间的媒介,代码可以将高级目标转换为可执行的中间步骤,具有语法标准、逻辑一致、抽象和模块化的特点。 最近,来自伊利诺伊大学香槟分校...
-
三星:2023年前旧机型不支持Galaxy AI
快科技1月28日消息,三星最近发布了Galaxy S24系列手机,三星已经确认Galaxy AI将登陆一部分旧设备。 其中包括Galaxy S23系列(S23/S23 /S23 Ultra/S23 FE)手机、Galaxy Tab S9系列(Tab S9/...
-
AIGC笔记总结(一):扩散模型简介
?个人主页: GoAI |? 公众号: GoAI的学习小屋 | ?交流群: 704932595 |?个人简介 : 掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等,专注大数...
-
从20亿数据中学习物理世界,基于Transformer的通用世界模型成功挑战视频生成
建立会做视频的世界模型,也能通过Transformer来实现了! 来自清华和极佳科技的研究人员联手,推出了全新的视频生成通用世界模型——WorldDreamer。 它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序...
-
# ext-to-speech|tts|voice-cloning|AIGC|多模态#【有图文部署】GPT-SoVits:上线一周就获得了4.1k star!效果炸裂的开源跨语言音色克隆模型!
一周前,RVC变声器创始人(GitHub昵称:RVC-Boss)发布了一款新项目,名为GPT-SoVITS。这个项目一上线就受到了互联网大佬和博主的好评推荐,仅仅在不到一周的时间里,就已经在GitHub上积累了4.1k Star。 据说,该项目是RVC-...
-
谷歌再雪前耻,新Bard逆袭GPT-4冲上LLM排行榜第二!Jeff Dean高呼我们回来了
一夜之间,Bard逆袭GPT-4,性能直逼最强GPT-4 Turbo! 这个听起来似乎像梦里的事情,确确实实地发生了。 就在昨天,谷歌首席Jeff Dean发推提前透露了谷歌的最新版模型——Gemini Pro-scale。 基于此,Bard相较于3月份...
-
Llama-2 推理和微调的硬件要求总结:RTX 3080 就可以微调最小模型
大语言模型微调是指对已经预训练的大型语言模型(例如Llama-2,Falcon等)进行额外的训练,以使其适应特定任务或领域的需求。微调通常需要大量的计算资源,但是通过量化和Lora等方法,我们也可以在消费级的GPU上来微调测试,但是消费级GPU也无法承载比...
-
OpenAI联创Karpathy发文:用自动驾驶诠释AGI!原贴已删速收藏
对于「通用人工智能」,OpenAI科学家Karpathy下场做出了解释。 前几天,Karpathy在个人blog发表了一篇文章「将自动驾驶作为AGI的一个案例来研究」。 不知是何原因,他却删除了这篇文章,幸而,还有网络备份。 众所周知,Karpat...
-
ChatGPT惊艳更新!一个@让三百万GPTs为你打工
部分(灰度 用户已经收到这样的提示: 现在可以在对话中@任意GPT商店里的GPTs,就像在群聊中@一个人。 体验到的博主Dan Shipper第一时间录视频激动地分享:一个改变游戏规则的功能。 在他的演示中,按过去的工作流程还需要手动把与ChatGP...
-
开源一个整合了AIGC大语言模型的SpringBoot智慧医药系统
前言 哈喽兄弟们,好久不见哦~ 最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的,虽然这些项目普遍都写的比较简单,但想一想既然放在电脑里面也吃灰,那么还不如开源分享出去,没准还可以帮助到一些小白新手。 本期就在其中选取了一个医...
-
大语言模型部署:基于llama.cpp在Ubuntu 22.04及CUDA环境中部署Llama-2 7B
llama.cpp是近期非常流行的一款专注于Llama/Llama-2部署的C/C++工具。本文利用llama.cpp来部署Llama 2 7B大语言模型,所采用的环境为Ubuntu 22.04及NVIDIA CUDA。文中假设Linux的用户目录(一般为...
-
最好用的AI写作神器都在这了
伏案深思,提笔难落,灵感犹如挤牙膏般难寻,这是大多数文字工作者的常态,但是人工智能技术的不断发展,AI写作软件逐渐成为了现代写作的新宠,大大释放了大脑的压力,这些软件利用强大的自然语言处理和机器学习算法,能够帮助用户快速生成高质量的文章。在国内,有许多优秀...
-
Llama 2: Open Foundation and Fine-Tuned Chat Models
文章目录 TL;DR Introduction 背景 本文方案 实现方式 预训练 预训练数据 训练细节 训练硬件支持 预训练碳足迹 微调 SFT SFT 训练细节 RLHF 人类偏好数据收集 奖励模型 迭代式微调(RLHF) 拒...
-
AIGC时代-GPT-4和DALL·E 3的结合
在当今这个快速发展的数字时代,人工智能(AI)已经成为了我们生活中不可或缺的一部分。从简单的自动化任务到复杂的决策制定,AI的应用范围日益扩大。而在这个广阔的领域中,有两个特别引人注目的名字:GPT-4和DALL·E 3。这两个AI系统在各自的领域内都取得...
-
为Stable Diffusion web UI开发自己的插件实战
最近,Stable Diffusion AI绘画受到了广泛的关注和热捧。它的Web UI提供了了一系列强大的功能,其中特别值得一提的是对插件的支持,尤其是Controlnet插件的加持,让它的受欢迎程度不断攀升。那么,如果你有出色的创意,如何将其融入Sta...
-
AIGC智能编程:提高编程效率与代码质量的安全可靠之选
AIGC智能编程的安全性和可靠性如何? 介绍 随着人工智能技术的不断发展,AIGC(Artificial Intelligence Guided Coding)智能编程成为了越来越热门的领域。AIGC智能编程是指利用人工智能技术来辅助编写代码,提高编...
-
Grok犯傻自曝抄袭,ChatGPT拱火,马斯克被“插刀”!看生成式AI如何吞噬互联网
整理丨诺亚 马斯克旗下AI公司xAI推出的首款聊天机器人Grok号称“百无禁忌”,也正是这个无禁忌AI面世不久,就给马斯克捅了个大篓子! 一名安全测试员 Jax Winterbourne 上个月在推特上发布了一张 Grok 拒绝查询的屏幕截图,内容显...
-
体验百度文心一言、字节跳动豆包和讯飞星火AI大模型生成泰勒·斯威夫特biography
Taylor Swift,1989年12月13日出生于美国宾夕法尼亚州,美国乡村女歌手、演员、编剧、制片人。其部分获奖信息如下: 奖项 时间 颁奖方 第52届格莱美奖年度专辑奖 2008年 格莱美奖 第47届乡村音乐协会奖“巅峰奖” 201...
-
过去两周,六个最有可能改变AI进程的发布!
编译 |言征 过去两周,新的人工智能更新不断涌现,异常疯狂。我们决定整理最近发布的六大框架和模型。 1、ActAnywhere:主题感知视频背景生成 图片 Adobe Research和斯坦福大学推出了Act Anywhere,这是一种生成模型,解决了电...