-
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万
文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。 但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。 图源:https://twitter.com/...
-
微软用GPT-4V解读长视频 MM-Vid能看懂电影还能讲给盲人听
近期,微软Azure AI发布了MM-Vid,这是一项结合GPT-4V与专用工具的创新,致力于解读长视频并为视障人士提供更好的体验。 目前,人工智能在长视频理解领域所面临的复杂挑战,包括分析多个片段、提取不同信息源、实时处理动态环境等。而MM-Vid的工作...
-
Google Bard VS ChatGPT:哪个是更好的AI聊天机器人?
文章目录 前言 一、Bard和ChatGPT的宏观对比 二、应用场景不同 三、知识的时效性 四、未来的归宿 总结 前言 自从 OpenAI 向公众发布ChatGPT以来的过去几个月里,我们都见证了围绕 ChatGPT 的各种测评...
-
浅析半监督学习及其应用场景
Labs 导读 随着互联网的发展,企业可以获得越来越多的数据,这些数据可以用于帮助企业更好的了解用户,即客户画像,也可以用来改善用户的体验。但这些数据中可能存在大量没有标记的数据。如果所有数据均采用人工标记的方式则存在两方面的缺点,一是花费的时间成本较...
-
维基百科创始人公开表示对 ChatGPT 的可靠性表示担忧
维基百科创始人 Jimmy Wales 在本周在里斯本举行的 Web Summit 上对 ChatGPT 作为可靠信息来源的使用表示担忧。这次峰会的讨论主题主要是人工智能。他在讨论人们对生成式人工智能使用的挑战时表示:“ChatGPT 是一件很棒的玩具等等...
-
VsCode 安装Copilot
1,插件安装 (1)首先我们在 VSCode 里面搜索并安装 Copilot 插件: (2)安装后编辑器右下角会出现一个小机器人图标,并且提示我们需要登录 GitHub 账号: 此时需要科学 目前要收费劝退了很多小伙伴,但是...
-
比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平
今天我们提到大型语言模型(LLM),第一个想到的就是 OpenAI 的 ChatGPT。一年来,ChatGPT 因其强大的性能,广泛的应用前景而爆火出圈。但谈到大型语言模型,ChatGPT 并不是第一个。 一年前,也就是 OpenAI 发布 ChatGP...
-
长虹将发布全球首个基于大模型的智慧家电 AI 平台
长虹公司宣布将在11月20日发布全球首个基于大模型的智慧家电 AI 平台。 这个平台将结合生成式人工智能大模型和长虹自主研发的 AI 技术,应用于智能家电,首先在智能电视上进行应用。 长虹表示,其早在2016年就发布了全球首台人工智能电视,引领智能家电行...
-
AI绘画新秀-免费使用-Leonardo(Midjourney对手)注册教程
本教程收集于:AIGC从入门到精通教程 AI绘画新秀-免费使用-Leonardo(Midjourney对手) 保姆级注册教程 目录 一、写在前面的话。 二、纯文字教程 2.1 Leonardo注册教程:...
-
Yolo V8:深入探讨其高级功能和新特性
Yolo是一种计算机视觉模型,被广泛认为是目前最强大和最知名的模型之一。这一突破性技术被称为Yolo,它是“You Only Look Once”的缩写,是一种以几乎瞬间处理速度检测物体的方法。Yolo V8技术是这一技术的最新版本,也是对之前版本的一种...
-
Airbnb收购神秘AI初创公司GamePlanner.AI
在一项战略性举措中,Airbnb宣布收购了一家神秘的人工智能(AI)初创公司,GamePlanner.AI,据报道收购价格约为2亿美元。这家初创公司由Adam Cheyer和Siamak Hodjat共同创立,两人分别是Siri和Bixby两个知名AI助手...
-
【微信小程序开发】小程序的事件处理和交互逻辑(最详细)
前言 在微信小程序中,事件处理和交互逻辑是开发过程中非常重要的环节,它们直接影响到用户体验和功能实现。今天为大家继续详解小程序的事件处理和交互逻辑 文章目录 前言 为什么要学习事件处理和交互逻辑? 事件处理基础 事件类型和...
-
微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
世界各地的人们每天都会创造大量视频,包括用户直播的内容、短视频、电影、体育比赛、广告等等。 视频是一种多功能媒介,可以通过文本、视觉和音频等多种模态传递信息和内容。如果可以开发出能学习多模态数据的方法,就能帮助人们设计出具备强大能力的认知机器 —— 它不...
-
文心一言怎么清除记录 文心一言4.0版本收费标准
文心一言具备广泛的应用能力,涵盖了文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成等。这些能力使其在搜索问答、内容创作生成、智能办公等领域展现出广阔的应用前景。 例如,在企业服务领域,文心一言可以帮助企业进行内容创作、客服问答优化、数据分析等,极...
-
OpenAI 上线新功能力捧 RAG,开发者真的不需要向量数据库了?
近期, OpenAI 的开发者大会迅速成为各大媒体及开发者的热议焦点,有人甚至发出疑问“向量数据库是不是失宠了?” 这并非空穴来风。的确,OpenAI 在现场频频放出大招,宣布推出 GPT-4 Turbo 模型、全新 Assistants API 和一系...
-
代码实现stable-diffusion模型,你也用AI生成获得一等奖的艺术图
Midjourney工具获奖图片 好吗,人工智能虽然已经涉及到人类的方方面面,但没有想到,AI 还能抢艺术家的饭碗,这不,一位小哥使用AI工具生成的艺术照片竟然获奖了,而且还是一等奖,且最近刚刚火起来的stable diffusion 更是让艺术家与AI...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
SymphonyAI发布突破性AI金融犯罪调查案例管理平台
SymphonyAI Sensa-NetReveal日前宣布推出Sensa Investigation Hub,这是亚太地区首个高影响力的AI变革金融犯罪调查和检测平台。该平台利用先进的预测和生成式AI技术,结合全球领先的风险和合规专业知识,为金融机构提供...
-
在 MacOS 上安装 Stable Diffusion ,如何免费生成 AI 图像的分步指南
在本文中,我们将指导您在 MacOS 上安装 Stable Diffusion。安装过程免费、简单且相对较快。让我们开始吧! 1. 通过终端安装 Homebrew。 第一步包括通过终端安装Homebrew ,除非您已经安装了它。Homebrew 帮助...
-
不是LlaMa套壳!李开复麾下大模型陷套壳争议,团队二次回应来了!
整理丨诺亚、小欧 出品 | 51CTO技术栈(微信号:blog51cto) 昨天科技圈社区Hacker News突然出现一则消息,矛头直指不久前发布的大模型Yi-34B,认为其除了两个张量被重新命名外,完全使用了Llama的架构。 图片 而根据公开信息,...
-
腾讯三季度研发投入164.5亿元,腾讯混元大模型助力多业务提效
站长之家(ChinaZ.com 11月15日 消息:腾讯在研发和专利方面持续领先,大模型推动业务增长。根据最新财报,腾讯三季度研发开支同比增长9%,达到164. 5 亿元,自 2018 年以来累计投入超过 2532 亿元。 在全球范围内,腾讯的专利申请公...
-
Ubuntu20.04本地部署Stable-Diffusion-webui AI绘画环境
最近AI绘画很火,所以想在本地部署个环境体验一下。原本打算在Windows下安装,网上有很多教程,也有很多大佬做了整合包,可是我的Windows系统下的显卡驱动版本太低,也没法升级,只能装CUDA9,导致安装torch会出现问题。所以考虑在Ubuntu下安...
-
解释:生成式 AI的工作机制与差异
像 ChatGPT 这样强大的生成式 AI 系统是如何工作的,它们与其他类型的人工智能有何不同? 快速浏览一下头条新闻,就会发现生成式人工智能如今无处不在。事实上,其中一些标题实际上可能是由生成式人工智能撰写的,例如 OpenAI 的 ChatGPT,...
-
新加坡推Agent4Rec 大模型智能体构成推荐系统模拟器
推荐系统领域长期存在线上线下效果差距大的问题,Agent4Rec通过构建大语言模型智能体,模拟真实用户行为,为解决这一问题提供了新的思路。在Agent4Rec中,每个用户智能体由个性化模块构成,根据用户历史交互生成电影偏好,模拟用户在推荐系统中的行为。通过...
-
Stable Diffusion - 提示词翻译插件 sd-webui-prompt-all-in-one
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131649921 sd-webui-prompt-all-in-o...
-
大模型幻觉排行榜GPT-4夺冠,英伟达科学家强力打假!Meta版ChatGPT一作发长文鸣冤
大模型的幻觉问题,是业内老生常谈的话题了。 最近,一个名为Vectara的机构,在GitHub推出了一个大模型幻觉排行榜。 结果显示,在总结短文档方面,GPT-4的表现最为优异,而Google Palm的两款模型直接垫底! 其中GPT-4的准确率为97...
-
深势科技推出多模态科学文献大模型Uni-Finder
深势科技推出了 Uni-Finder,一个革命性的智能文献数据库平台,通过多模态检索功能和自然语言交互技术,提高科学文献的阅读和分析效率。 Uni-Finder 基于科学多模态大模 Uni-SMT,综合考虑文献中的多模态元素,如图表、数学方程、分子结构等...
-
百度搜索智能化算力调控分配方法
作者 | 泰来 导读 随着近年深度学习技术的发展,搜索算法复杂度不断上升,算力供给需求出现了爆发式的增长。伴随着AI技术逐步走到深水区,算法红利在逐步消失,边际效应日益显著,算力效能的提升尤为重要,同时随着宏观经济影响,大规模的算力需求供给也遭...
-
关于【Stable-Diffusion WEBUI】生成全身图:插件解决面部崩坏问题
文章目录 (零)前言 (一)脸难看的问题 (1.1)面部修复 (1.2)远景脸部问题 (二)面部修复插件(Face Editor) (2.1)模型文件下载 (2.2)例图参数 (零)前言 本篇主要介绍WEBUI的插件...
-
ChatGPT Plus账号暂停注册!网友炸锅,卖号租号全网溢价
就在刚刚,Sam Altman在X上宣布惊天大雷—— ChatGPT Plus账号注册,现在开始暂停! 他表示,自从devday开发日后,访问量的激增已经远远超出了OpenAI的承受能力。 为了确保每个用户的良好体验,Plus账号的注册需要暂停一段时间...
-
成本2元开发游戏,最快3分钟完成!全程都是AI智能体“打工”,大模型加持的那种
家人们,OpenAI前脚刚发布自定义GPT,让人人都能搞开发;后脚国内一家大模型初创公司也搞了个产品,堪称重新定义开发——让AI智能体们协作起来! 只需一句话,最快3分钟不到,成本也只要2元多,“啪~”,一个软件就开发完了。 例如开发一个红包雨的小软件,现...
-
【Stable Diffusion】Stable Diffusion各类模型描述
Stable Diffusion 是一种新型的生成模型,它可以用于生成高质量的图像、文本和音频等多种形式的数据。目前已经出现了许多基于 Stable Diffusion 模型的变种,下面简单介绍其中几种比较流行的模型: 模型链接:https://hugg...
-
北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断
手是人类与世界交互的重要部分,手的缺失(如上肢残障)会大大影响人类的正常生活。 北京大学董豪团队通过将扩散模型和强化学习结合,使机械手能根据人手腕部的移动轨迹,自适应的抓取物体的不同部位,满足人类多样化的抓取需求,目前该工作已被NeurIPS 2023接...
-
AI视野:OpenAI暂停ChatGPT Plus用户注册;Bing Chat将推离线模式;C站获510万美元融资;AI智能导购助手京东京言上线
???AI新鲜事 OpenAI暂停ChatGPT Plus用户注册 由于ChatGPT的激增使用量导致服务器负担过大,OpenAI决定暂停新用户注册ChatGPT Plus账号,以确保服务稳定。 微软计划推出Bing Chat离线模式 微软计划通过引入...
-
文心一言人工智能使用教程和操作方法
文心一言人工智能使用教程和操作方法 文心一言是一款由百度研发的基于人工智能技术的语言模型,它能够帮助人们回答各种各样的问题,同时还可以协助完成文本创作、智能办公、智能家居控制等多种任务。下面是文心一言的使用教程,希望能够帮助您更好地使用这款神奇的工具。...
-
IBM 启动5亿美元企业人工智能风险基金,以支持初创公司
IBM近日推出新的企业投资工具,即企业人工智能风险基金,计划通过该基金支持那些开发以企业为重点的人工智能产品的初创公司。 其他科技巨头在IBM此举之前也加大了对人工智能创业生态系统的投资。几周前,大型语言模型开发商Anthropic PBC从亚马逊公司和...
-
面壁智能发布SaaS级产品ChatDev 以及千亿参数大模型 “CPM-Cricket”
面壁智能推出了基于群体智能的 AI 原生应用 ——“面壁智能 ChatDev” 智能软件开发平台。 ChatDev 是一个可视化交互平台,用户只需简单设置和需求说明,就能在最快3分钟内生成可直接运行的应用程序。 SaaS 版 ChatDev 提供了高效、低...
-
百度文心一言
1分钟了解一言是谁? 一句话介绍【文心一言】 我是百度研发的人工智能模型,任何人都可以通过输入【指令】和我进行互动,对我提出问题或要求,我能高效地帮助你们获取信息、知识和灵感哦 什么是指令?我该怎么和你互动? 指令(prompt)其实就是文...
-
微软推出 XOT 方法,提升语言模型推理能力
11 月 15 日消息,微软近日推出了名为“Everything of Thought”(XOT)的方法,灵感来自谷歌 DeepMind 的 AlphaZero,利用紧凑的神经网络,来增强 AI 模型推理能力。 微软和佐治亚理工学院、华东师范大学...
-
本田等日本汽车制造商引入生成式AI进行车辆设计
在全球汽车行业竞争加剧的背景下,日本汽车制造商正迎来一项革命性的技术进步,他们正在引入生成式人工智能(Generative AI)来协助车辆设计。 据了解,本田(Honda)、索尼本田移动(SHM 和斯巴鲁等知名公司已经纳入这一先进技术,并将其应用于汽车设...
-
程序员推荐!JetBrains IDEs使用技巧与必备插件
JetBrains是耳熟能详的软件开发工具提供商,旗下的IDE集成开发环境被广泛应用于不同的开发领域。本文将向新手介绍JetBrains IDEs的基本知识和常用功能。 什么是JetBrains IDEs? JetBrains IDEs是一套面向软件开发...
-
S-LoRA:一个GPU运行数千大模型成为可能
一般来说,大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是,当针对众多任务(如个性化助手)对 base 模型进行微调时,训练和服务成本会变得非常高昂。低秩适配(LowRank Adaptation,LoRA)是一种参数效率高的微调方法,通常用...
-
谷歌DeepMind发布全新AI天气预报模型GraphCast 1分钟预测10天全球天气
谷歌DeepMind最新推出的全球天气预报AI模型GraphCast引起科学界瞩目。这一模型不仅能在短短1分钟内预测未来10天的全球天气,甚至还能准确预测极端天气事件。通过在欧洲中期天气预报中心(ECMWF)近40年的数据上进行训练,GraphCast表现...
-
【stable diffusion】保姆级入门课程04-Stable diffusion(SD)图生图-局部重绘的用法
目录 0.本章素材 1.什么是局部重绘 2.局部重绘和涂鸦有什么不同 3.操作界面讲解 3.1.蒙版模糊 3.2.蒙版模式 3.3.蒙版蒙住的内容 3.4.重绘区域 4.局部重绘的应用(面部修复) 5.课后训练 0.本章素材...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
OpenAI暂停ChatGPT Plus用户注册 因超出服务器承受范围
今天上午,OpenAI的CEO Sam Altman在社交平台上宣布,由于近期ChatGPT的使用量激增,超出公司的承受能力,因此他们决定暂停新的ChatGPT Plus账号注册,以确保每位用户都能有良好的使用体验。 对此,Altman公开致歉,称新功能...
-
AIGC专栏6——通过阿里云与AutoDL快速拉起Stable Diffusion和EasyPhoto
AIGC专栏6——通过阿里云与AutoDL快速拉起Stable Diffusion和EasyPhoto 学习前言 Aliyun DSW快速拉起(新用户有三个月免费时间) 1、拉起DSW 2、运行Notebook 3、一些小bug AutoD...
-
使用Python从图像中提取表格
大约一年前,我被分配任务从文件中提取和结构化数据,主要是包含在表格中的数据。我之前对计算机视觉没有了解,并且很难找到一个合适的“即插即用”的解决方案。当时可选的方案要么是基于最新神经网络(NN)的解决方案,这些解决方案庞大而繁琐,要么是基于OpenCV的...
-
由马斯克 Grok AI 启发的 GROK 代币市值蒸发近 1 亿美元
在过去 24 小时内,受到疑似与多个失败项目关联的开发者影响,由 X 启发的 AI 代币 GROK 的市值近乎蒸发了 1 亿美元。 尽管 GROK 与埃隆·马斯克旗下的 X 公司开发的聊天机器人服务 Grok AI 有所启发,但两者并无直接联系。 GRO...
-
.Net 使用OpenAI开源语音识别模型Whisper
.Net 使用OpenAI开源语音识别模型 Whisper 前言 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的 Whisper 神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音...