-
微软开发新型大模型压缩方法SliceGPT
SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数(包括嵌入)。 这意味着使用SLICE...
-
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
比斯坦福炒虾机器人还厉害的机器人来了! 最近,CMU的研究者只花费2.5万美元,就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。 论文地址:https://arxiv.org/abs/2401.14403 厉害之处就在于,它是完全自主完成操作...
-
微软CEO将于2月7日访问印度 将与多位AI创始人会面
微软公司首席执行官萨蒂亚·纳德拉将于 2 月 7 日和 8 日访问印度,这是他每年对该国的例行访问, 2024 年的主要主题是人工智能(AI)及其机遇。 几周前,微软印度和南亚地区总裁普内特·钱多克在一封内部邮件中表示,纳德拉的访问强化了微软利用技术扩大...
-
ChatGPT和文心一言哪个好用?
#ChatGPT 和文心一言哪个更好用?# 在当今信息爆炸的时代,人们对于文本生成和创作工具的需求越来越高。在这个背景下,ChatGPT和文心一言作为备受瞩目的工具,各自拥有独特的功能和用途。在本文中,我们将深入探讨这两个工具的优势和适用场景,以帮助读者...
-
更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目
近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。 在这一背景下,M-A-P 开源社区、港科大、滑铁卢大学、零一万物等联合推出了面向中文大规模多...
-
抖音即创体验入口 AI生成视频图文在线使用地址
抖音即创工作台是一款一站式的智能创意生产与管理平台。作为一个全流程服务的创意助手,它集成了视频创作、图文创作、直播创作等多种创意工具,通过AI的力量大大提高了创作效率。无论是视频、图文还是直播内容,抖音即创都能助你轻松应对。主要功能和优势包括: 视频...
-
Unity3d引擎中使用AIGC生成的360全景图(天空盒)
前言 在这里与Skybox AI一起,一键打造体验无限的360°世界,这是这个AIGC一键生成全景图的网站欢迎语。 刚使用它是23年中旬,在没有空去给客户实地拍摄全景图时,可以快速用它生成一些相关的全景图,用作前期沟通的VR demo。当时使用所有都...
-
OT系统如何应对生成式AI带来的安全挑战?
如今,大多数网络攻击主要使用两种方法:数据泄露和数据加密。这些策略被证明是有效的,因为攻击者可以通过威胁发布泄露的数据或要求支付解密费用来勒索钱财。这些攻击虽有恶意,但程度有限。他们的目标通常不是给人们造成重大伤害,但也有攻击者走得更远的情况。 在现代...
-
AI生成动画图像视频在线使用地址 Animate Anyone体验入口
Animate Anyone旨在通过驱动信号从静态图像生成角色视频,是一款专为角色动画量身定制的新框架。利用扩散模型的力量,该工具在角色动画方面表现出色。为了保持参考图像中复杂外观特征的一致性,设计了ReferenceNet来通过空间注意力合并详细特征。为...
-
【AIGC】从零手写一个GPT
手写一个GPT 在GPT,确切的说是Transformer,出现之前,一个问题长久地困扰着人们——如何让两句内容不同、但语义相近的句子得到较为接近的表示。 比如我们有两句话 我喜欢你 吾中意你 它们作为句子内容并不一样,但是表达的含义却...
-
GenAI成功道路上的十个“坑”
想要实现生成式人工智能(GenAI)?是个好消息!大多数IT决策者都看到了这种变革性技术的潜力,您可以将自己视为其中之一。虽然GenAI有可能为业务增加显著的效率,但它也带来了一系列必须克服的挑战。 以下是实施GenAI的十大挑战,按重要性降序排列。...
-
谷歌与Singular Computing达成AI专利纠纷和解
谷歌刚刚和一家人工智能技术专利诉讼的对手达成了数十亿美元的和解。这家硬件和软件开发公司Singular Computing从谷歌那里获得了一笔未公开的和解金,这结束了Singular的创始人Joseph Bates博士对谷歌提起的长达五年的联邦法院专利侵权...
-
Windows11 Copilot助手开启教程(免费GPT-4)
Windows11上开启Copilot助手教程+踩坑指南 Copilot介绍 Copilot开启步骤 1、更新系统 2、更改语言和区域 3、下载 ViVeTool 工具 4、开启Copilot 使用 Copilot介绍 Win...
-
全球代码质量骤降,罪魁祸首竟是AI!1.53亿行代码深度分析报告出炉
AI正在使全球的代码质量下降! 最近,GitClear发布的一项调查报告显示,用AI写代码,会让代码的质量和可维护性不断下降。 这引起了全网热烈讨论: 「借助AI提供商,您可以将代码生成速度提高50%(即使是您不理解或无法编写的代码),但代价是代码的质...
-
谷歌与Hugging Face携手,共推开源模型助力AI发展
Google与Hugging Face近日宣布战略合作,旨在推动开放AI和机器学习的发展。这一合作将集成Hugging Face的平台与Google Cloud的基础设施,包括Vertex AI,旨在使生成式AI更易于开发者使用。这一合作的重要性被认为是A...
-
Stable Diffusion XL总结
Stable Diffusion XL是一个二阶段的级联扩散模型,包括Base模型和Refiner模型。其中Base模型的主要工作和Stable Diffusion一致,具备文生图,图生图,图像inpainting等能力。在Base模型之后,级联了Refi...
-
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABAB CDCD EFEF GG」执行。 同时,诗中还要包含提供的3个词。 对于这么高难度的创作题,LLM在收到指令后,并不一定能够按要求做出这首诗。 正所谓,人各有所长,LLM也是如此,仅凭单...
-
腾讯文档智能助手体验入口 AI文档写作、数据分析、PPT制作在线使用地址
腾讯文档智能助手是一款强大的AI文档工具,可广泛应用于文档写作、数据分析、演示文稿制作等场景,辅助实现高效办公和创作。该智能助手正式开启公测,与Word、Excel、PPT等多品类文档进行智能互动,支持内容秒级生成,实现数据处理、版式美化等创作辅助功能。主...
-
无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务
文本嵌入(word embedding)是自然语言处理(NLP)领域发展的基础,可以将文本映射到语义空间中,并转换为稠密的矢量,已经被广泛应用于各种自然语言处理(NLP)任务中,如信息检索(IR)、问答、文本相似度计算、推荐系统等等, 比如在IR领域,第...
-
《幻兽帕鲁》使用了哪些人工智能技术?palworld如何应用AI技术
《幻兽帕鲁》是一款开放世界生存游戏,玩家可以收集和利用各种神奇的生物“帕鲁”。这款游戏引起了很多关注,也引发了一些争议,有人质疑它是否使用了生成式AI技术来设计游戏内容。 点击前往AI:Art Impostor体验入口 与《幻兽帕鲁》有关的AI产品或服务...
-
十分钟读懂Stable Diffusion运行原理
AIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊...
-
AI也造代码屎山!研究发现GitHub Copilot代码可维护性差,偏爱“无脑重写”而非重构复用已有代码
AI帮忙写代码程序员用了都说好,但代码质量真的靠谱吗? 结果或许令你大跌眼镜。 一家名为GitClear的公司分析了近四年超过1.5亿行代码后发现,随着GitHub Copilot工具的加入,代码流失率(即代码写入后不久又被返工修改、删除的情况)出现了显...
-
百川智能发布大模型Baichuan3 称中文评测超越GPT-4
百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT- 4 的水平。同时,该模型在数学和...
-
30 年首次改版,微软为 AI 对 PC 下手,在键盘上新增 Copilot 键
一键启动 Copilot 生成式 AI 助手 “全面拿下 AI”,如今的微软正在冲破软件的束缚,开始向硬件设备发起挑战。 1 月 4 日,微软带来最新消息:希望 2024 年能成为“AI PC 年”,于是,其为 Windows 11 电脑推出一个全新的...
-
从零手搓MoE大模型,大神级教程来了
传说中GPT-4的“致胜法宝”——MoE(混合专家)架构,自己也能手搓了! Hugging Face上有一位机器学习大神,分享了如何从头开始建立一套完整的MoE系统。 这个项目被作者叫做MakeMoE,详细讲述了从注意力构建到形成完整MoE模型的过程。...
-
Unbound官网体验入口 AI产品照片生成工具在线使用地址
Unbound– AI 产品照片 是一款利用人工智能生成逼真产品照片的工具。无论您是自动化在线业务、社交媒体、广告宣传还是其他场景的用户,Unbound都能满足您的需求。它可以在几秒钟内生成任何尺寸的产品照片,根据用户提供的透明图片生成无限多的专业产品照片...
-
比亚迪发布璇玑AI大模型;微软推出Copilot Pro;国内首个MoE模型上线
比亚迪发布璇玑 AI 大模型 1 月 16 日,在 2024 比亚迪梦想日活动上,比亚迪正式发布了整车智能化架构「璇玑」及「璇玑 AI 大模型」。 比亚迪产品规划及汽车新技术研究院院长杨冬生称,「璇玑」是行业首个智电融合的智能化架构,让汽车拥有...
-
AI时代来了,专业摄影师会被淘汰吗?
现在科技界几乎已经形成一种共识,即随着AI的进化,很多职位将会被替代,当中就包括专业摄影师。 Medium在报告中指出:“随着AI和图像处理技术的发展,摄影正在从高技巧创作变成了以技术驱动的创作。在技术的加持下,即使是普通用户,也可以拍出高质量影像,传...
-
LangGraph:构建智能对话的AI库,轻松打造复杂、有记忆的应用
在构建能够对用户输入做出响应、记住过去互动并基于历史做出决策的系统时,LangGraph库成为解决这一问题的关键工具。这一需求对于创建更像智能代理的应用至关重要,这些应用能够保持对话、记住先前的上下文,并做出明智的决策。 当前存在一些解决方案,它们可以部分...
-
学习之旅:揭秘AI绘画与视频生成的奥妙(2)
前言 在这篇文章中,我们将深入探讨如何使用Ebsynth Utility插件为视频带来全新的视觉效果。通过重绘视频,我们可以实现对视频风格的调整,为其增添独特的艺术氛围。我们将分享实际操作步骤以及过程中可能遇到的问题,帮助大家更好地掌握这...
-
360度无死角!UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作
输入一张任意姿势的照片,想让照片里的人跟随「指定视频」来进行动作模仿并不简单,除了肢体动作的模仿外,模型还需要对运动过程中衣服、人物外观的变化进行建模。 如果输入图像是正面的,而模仿的视频动作包括转身的话,模型还需要「想象」出衣服的背面样子,以及衣...
-
谷歌AI研究提出 SpatialVLM:一种数据合成和预训练机制,以增强视觉语言模型 VLM 空间推理能力
谷歌AI研究团队最近提出了SpatialVLM,这是一种旨在增强视觉语言模型(VLMs)空间推理能力的创新系统。 尽管先进的模型如GPT-4V在人工智能驱动任务中取得了显著进展,但它们在空间推理方面仍存在显著局限。空间推理涉及理解物体在三维空间中的位置以及...
-
AWS Iot Device Shadows
参考连接:AWS IoT Device Shadow 服务 - AWS IoT Core (amazon.com 1、 Device shadow基本概念 设备的影子是用于存储和检索设备的当前状态信息的 JSON 文档。(存储在AWS IOT c...
-
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
来了,贾扬清承诺的 Lepton Search 开源代码来了。 前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。 项目链接:https://github.com/le...
-
三星与百度合作,为Galaxy S24系列创造AI体验
三星在中国选择了一个合法的替代方案,即与百度AI Cloud展开合作。这一战略伙伴关系的宣布意味着三星电子中国和百度将共同创造一种AI体验,以提升三星Galaxy S24系列的功能。 在这次合作中,百度的文心一言基础模型将与Galaxy AI深度集成,为...
-
ChatGPT与文心一言:谁更胜一筹?
在人工智能领域,语言模型的发展日新月异,ChatGPT与文心一言作为市面上两款备受瞩目的AI助手,各自具有一定的优势。本文将从智能回复、语言准确性和知识库丰富度等方面,对这两大AI助手进行比较,以期为大家提供一些参考。 一、智能回复 在智能回复方面,C...
-
Meta官方的Prompt工程指南:Llama 2这样用更高效
Meta官方的Prompt工程指南:Llama 2这样用更高效...
-
通义千问视觉语言模型Qwen-VL在线体验入口 阿里云AI在线使用入口
Qwen-VL是阿里云推出的通用型视觉语言模型,具备强大的视觉理解和多模态推理能力。采用 Transformer 结构,以 7B 参数规模进行预训练,支持 448x448 分辨率,能够端到端处理图像与文本的多模态输入与输出。Qwen-VL在多个视觉基准测试...
-
人工智能和机器学习在物联网中的作用有哪些
将人工智能(AI 和机器学习(ML 集成到物联网(IoT 系统中,标志着智能技术发展的革命性一步。这种融合通常被称为AIoT(物联网人工智能 ,不仅是能力的增强,而且是物联网系统如何运行、学习和适应环境的根本转变。让我们来探讨一下这种集成及其含义。 人...
-
黑石集团正建造价值250亿美元的巨型AI数据中心
黑石集团正建造一个价值 250 亿美元的巨型数据中心。这家私募股权巨头称,数据中心可能是其有史以来最好的投资之一——但是,要实现增长,所需的资源是巨大的。 图源备注:图片由AI生成,图片授权服务商Midjourney 该数据中心将建在美国凤凰城的一条高速...
-
AI在工业物联网(IIoT)中的安全管理与应用
作者 | 陈峻 审校 | 重楼 在开放的工业互联网环境中,数百万个基于物联网的终端和中间设备,需要全天候地持续通信并保持在线状态。不过,这些设备往往由于最初设计上的限制,在机密性、完整性、可用性、扩展性、以及互操作性上,存在着各种安全漏洞与隐患。与此同时...
-
福原爱首场直播带货额不足2.5万元 AI「直播带货」应用有哪些?
关于福原爱首场直播带货不足2. 5 万元的消息引发了人们对于明星带货直播的关注。在这场直播中,福原爱展示了 24 件商品,包括日常用品如龙年红包、纸巾、牙刷、手机壳装饰、洗衣凝珠等,但观看人次仅有74. 2 万,峰值在线人数1. 9 万,平均在线人数刚刚超...
-
【腾讯云HAI域探秘】利用HAI搭建AI绘画应用,随心所欲,畅享创作乐趣
【腾讯云HAI域探秘】利用HAI搭建AI绘画应用,随心所欲,畅享创作乐趣 1️⃣基于HAI部署的StableDiffusionWebUI快速进行AI绘画 (1)创建并启动StableDiffusion应用服务器 (2)使用StableDiff...
-
检测路在何方?YOLOv8终极指南
本文经自动驾驶之心公众号授权转载,转载请联系出处。 YOLOv8是计算机视觉领域的最新发展,它是一种用于目标检测、实例分割和分类的最新先进模型。除了对模型架构本身的改进之外,YOLOv8通过一个用于使用YOLO模型的PIP包为开发者提供了一个新的友好界...
-
谷歌AI芯片TPU v5p在训练LLM方面比其前一代快2.8倍
谷歌正迅速成为其最好的朋友英伟达的强大对手——其超级计算机所使用的TPU v5p人工智能芯片比以往任何时候都更快、更大、更宽,甚至超过了强大的H100。谷歌在最近推出其Gemini人工智能模型的同时,也发布了其最新版本的旗舰张量处理单元(TPU),用于人工...
-
最新国内可用GPT4、Midjourney绘画、DALL-E3文生图模型教程
一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画,文档对话总结+DALL-E3文生图,相信对大家应该不感到陌生吧?简单来说,GPT-4技术比之前的GPT-3.5相对来说更加智能,会根据用户的要求生成多种内容甚至也可以...
-
谷歌云与Hugging Face签署人工智能基础设施合作协议
谷歌公司(Google LLC)云计算部门今天宣布与Hugging Face公司建立新的合作伙伴关系,后者是一个流行的共享开源人工智能模型平台运营商。 根据协议,谷歌云将成为Hugging Face人工智能训练和推理工作负载的 “首选目的地”。此外,两...
-
大模型开山鼻祖!InstructGPT发布两周年了
今天是InstructGPT发布两周年的纪念日,它是现代大语言模型的开山鼻祖。Jim Fan介绍了InstructGPT的重要性并且说了几条关于InstructGPT非常有意思的点。还展示了InstructGPT中非常经典的三步LLM训练方法的图片,我也顺...
-
探索【Stable-Diffusion WEBUI】的图片超分辨插件:StableSR
文章目录 (零)前言 (一)图片放大 (二)图片超分辨率放大脚本插件(StableSR) (2.1)下载组件 (2.2)使用 (2.3)实例对比(放大) (2.4)实例对比(修复) (三)总结 (零)前言 本篇主要介绍W...
-
ADMap:用于重建在线矢量化高精地图的抗干扰框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://arxiv.org/pdf/2401.13172.pdf 代码链接:https://github.com/hht1996ok/ADMap 摘要 本文介绍了ADMap:用...