-
怎么使用midjourney?9个步骤教你学会AI创作
人工智能生成艺术作品的时代已经来临,互联网上到处都是试图创造完美提示的用户,以引导人工智能创造出正确的图像——有时甚至是错误的图像。听起来很有趣?Midjourney 是一种更常见的 AI 工具,人们用它只用几句话就能创造出梦幻般的风景和主题。 如果您想...
-
谷歌DeepMind机器人成果三连发!两大能力全提升,数据收集系统可同时管理20个机器人
几乎是和斯坦福“炒虾洗碗”机器人同一时间,谷歌DeepMind也发布了最新具身智能成果。 并且是三连发: 先是一个主打提高决策速度的新模型,让机器人的操作速度(相比原来的Robotics Transformer)提高了14%——快的同时,质量也没有下滑...
-
LeCun自曝曾因工资太低拒绝谷歌Offer!如果自己加入,会让谷歌研究文化更开放
图灵三巨头之一的LeCun,本来可以入职谷歌,甚至让它更开放? 最近,LeCun在网上分享出的这段陈年往事,让许多人大呼意外。 2002年,他拒绝了去谷歌当研究总监 原来,2002年1月,LeCun曾收到拉里·佩奇的邀请,去谷歌当研究主管。 不过,考虑...
-
研究称:英特尔Gaudi2技术在大语言模型推理方面媲美英伟达AI加速器
根据 Databricks 的最新研究,英特尔的 Gaudi2技术在大规模语言模型推理方面与业界领先的英伟达 AI 加速器相媲美。该研究发现,Gaudi2在解码方面的延迟与英伟达 H100系统相当,并且优于英伟达 A100。研究还发现,Gaudi2的推理性...
-
突破Pytorch核心点,优化器 !!
嗨,我是小壮! 今儿咱们聊聊Pytorch中的优化器。 优化器在深度学习中的选择直接影响模型的训练效果和速度。不同的优化器适用于不同的问题,其性能的差异可能导致模型更快、更稳定地收敛,或者在某些任务上表现更好。 因此,选择合适的优化器是深度学习模型调优中...
-
借助Midjourney创作龙九子图
(本文阅读时间:5 分钟) 《西游记》中有这么一段描写: 龙王道:“舍妹有九个儿子。那八个都是好的。第一个小黄龙,见居淮渎;第二个小骊龙,见住济渎;第三个青背龙,占了江渎;第四个赤髯龙,镇守河渎;第五个徒劳龙,与佛祖司钟;第六个稳兽龙,...
-
阿里云宣布“通义舞王”免费上线 :仅凭一张照片就可生成AI跳舞视频
快科技1月4日消息,近日,阿里云通义千问APP上线通义舞王”免费功能,仅凭一张照片就可生成多种AI热门跳舞视频。 操作很简单,在阿里云通义千问APP内输入通义舞王”、全民舞王”等暗号,并且按照提示要求上传照片后,等待十几分钟,即可生成舞蹈视频,还能很好保留...
-
pytorch快速训练ai作画模型的python代码
在 PyTorch 中训练 AI 作画模型的基本步骤如下: 准备数据集: 需要准备一个包含许多图像的数据集, 这些图像可以是手绘的或者是真实的图像. 定义模型: 选择一个适当的深度学习模型, 并使用 PyTorch 定义该模型. 例如...
-
【Bard vs. GPT-4】谷歌一雪前耻!全新PaLM 2反超GPT-4,办公全家桶炸裂升级,Bard史诗进化
在人工智能领域,自然语言处理一直是一个备受关注的领域。近日,谷歌发布了全新的PaLM 2,这一新技术一经问世,就引起了广泛的关注。 【更多阅读】 Google I/O 2023 全球开发者大会 Reveal Event_禅与计算机程序设计艺术的...
-
历史首人!美国13岁少年通关原版俄罗斯方块:此前仅有AI可完成
快科技1月4日消息,俄罗斯方块这款经典的游戏想必不少人都玩过,但能将其通关的人此前从未出现,近日,这一僵局终于被打破。 综合多家美国媒体报道,来自美国俄克拉何马州的13岁少年威利斯吉布森打通任天堂版俄罗斯方块”游戏的157关,最终游戏由于编码限制无法继续进...
-
Meta AI发布炸裂项目audio2photoreal 可将音频生成全身逼真的虚拟人物形象
Meta AI最近发布了一项引人注目的技术,他们成功地开发出一种能够从音频中生成逼真的虚拟人物形象的系统。 这个系统能够根据多人对话中的语音生成与对话相对应的逼真面部表情、完整身体和手势动作。这些虚拟人物不仅在视觉上非常逼真,而且能够准确地反映出对话中的手...
-
大模型中幻觉缓解技术的综合调查
大型语言模型(LLMs)是具有大量参数和数据的深度神经网络,能够在自然语言处理(NLP)领域实现多种任务,如文本理解和生成。近年来,随着计算能力和数据规模的提升,LLMs取得了令人瞩目的进展,如GPT-4、BART、T5等,展现了强大的泛化能力和创造力。...
-
文心一言接入Promptulate,开发复杂LLM应用程序
简介 最近在尝试将文心一言的LLM能力接入Promptulate,故写了一篇博客记录一下,Promptulate 是 Promptulate AI 旗下的大语言模型自动化与应用开发框架,旨在帮助开发者通过更小的成本构建行业级的大模型应用,其包含了LLM...
-
AIGC入门系列1:感性的认识扩散模型
1、序言 大家好,欢迎来到AI手工星的频道,我是专注AI领域的手工星。AIGC已经成为AI又一个非常爆火的领域,并且与之前的AI模型不同,AIGC更适合普通人使用,我们不仅可以与chatgpt对话,也能通过绘画模型生成想要的图片。很多朋友都想去深入的了解...
-
钉钉个人版正式全量上线 新增鹿班相机、灵动人像等多款 AI 工具
钉钉个人版已正式全量上线,推出多款 AI 工具,包括 AI 写真、涂鸦作画、法律助手等。用户可以通过钉钉个人版进行版本切换,使用 AI 工具进行个性化服务。 钉钉个人版在内测期间已经进行了多次更新,新增了鹿班相机、灵动人像等多款 AI 工具,为用户提供...
-
小冰公司“小冰大模型” 获得大模型备案
小冰公司宣布已获得 “小冰大模型” 国内备案,结束静默期,正式发布一系列产品。 首先是小冰克隆人,该产品允许创作者通过小冰框架技术克隆自己并向粉丝发布,已有超过 1000 名克隆人入驻,并有部分创作者实现个人 AI 年收入百万元。 其次是歌手克隆人分支...
-
让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接
来自清华大学交叉信息研究院的研究者提出了「GenH2R」框架,让机器人学习通用的基于视觉的人机交接策略(generalizable vision-based human-to-robot handover policies)。这种可泛化策略使得机器人能更...
-
生成式人工智能将改变医疗保健
生成式人工智能确实在医疗保健领域发挥着重要作用,它的应用为医疗行业带来了许多变革。人工智能能够利用大数据分析、模式识别和预测分析来改善医疗保健服务的质量和效率。 生成式人工智能有望显著提高生产力,改善患者和提供者的体验,并最终带来更好的临床结果。...
-
端到端的自动驾驶会取代Apollo、autoware这类框架吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in nuScenes 作者单位:百度 作者:共一 Jian...
-
llama.cpp LLM模型 windows cpu安装部署踩坑记录
一直想在自己的笔记本上部署一个大模型验证,早就听说了llama.cpp,可是一直没时间弄。 今天终于有时间验证了。首先本机安装好g++,cmake.我下载的cmake版本是cmake-3.27.0-rc4-windows-x86_64.msi。安装时选择...
-
从ChatGPT说起,AIGC生成模型如何演进
ChatGPT是继stable diffusion 之后,又一个火出圈的人工智能算法。这火爆程度不仅仅是科研圈子,包括投资圈都为之震惊,大家惊呼人工智能可能真的要取代人类了。网上关于ChatGPT的分析文章已经非常多了,小猿经过高强度的网络冲浪,整理出了A...
-
微软在Windows 11推出Copilot,将DALL-E 3集成在Bing!
美东时间9月21日,微软在美国纽约曼哈顿举办产品发布会,生成式AI成为重要主题之一。 微软表示,Copilot将于9月26日在Windows 11中推出;Microsoft 365 Copilot 将于11 月1日向企业客户全面推出;将OpenAI最新的...
-
2023年.AI域名销售额达550万美元 2024年能达1000万美元吗?
2024年,.AI域名市场是否能够创下1000万美元的销售额? 根据域名投资专家Elliot Silver的最新文章,2023年公开报道的.AI域名销售额已经达到了550万美元,而2022年和2021年分别为90万美元和120万美元。 Silver观察到过...
-
三星将在硅谷中心举办 Unpacked 揭秘全新AI聊天机器人
Galaxy Unpacked正式宣布,其下一代旗舰智能手机系列——Galaxy S24,将于1月17日星期三在加利福尼亚州圣何塞的SAP中心揭晓。这一令人期待的活动将在三星的YouTube页面上于太平洋时间上午10:00/ 东部时间下午1:00进行直播。...
-
版权过期后,米老鼠SD模型上线 以后可以放心用AI画米老鼠了
日前,迪士尼旧版米老鼠的版权正式过期,这意味着任何人都可以自由使用旧版米老鼠形象。 AI圈的开发者们手速也不可小觑,这不,才刚宣布过期没多久,他们就已经推出了米老鼠的SD模型Mickey-1928。 Mickey-1928是一个基于Stable-Diff...
-
探索Whisper语音识别
问题一:python多版本切换 背景:有了anaconda环境 还有一个c盘的不知道什么东西 我准备下载一个python3.9.9 去官网 然后安装,安装之前一定要把原来的python卸载干净。 3.9.9安装不上,我用3.10...
-
讯飞配音体验入口在哪 AI声音克隆软件推荐
讯飞配音是一款基于科大讯飞的人工智能语音技术的配音软件,它可以将文字转化为自然流畅的人声,支持多语种、多方言和中英混合,可灵活配置音频参数。讯飞配音的体验入口在哪呢,这里我们来看下讯飞配音的官方体验入口。 >>>点击前往 讯飞配音 官方...
-
科技部发文规范 AI 使用,禁用 AIGC 直接生成申报材料
IT之家 1 月 3 日消息,科技部监督司上个月编制印发《负责任研究行为规范指引(2023)》,《指引》从研究选题与实施、数据管理、成果署名、同行评议、伦理审查、监督管理等 11 个方面,对科研人员和科研机构、高等学校、医疗卫生机构、企业等(以下统称“...
-
AI修图小助手Inpaint wechat微信小程序上线 可选定图片区域进行消除修复
Inpaint_wechat 微信小程序已经上线了!这是一款基于微信AI能力的微信小程序,它可以实现图片选定区域的消除修复功能,并且是纯客户端实现,无需服务端的支持。 体验地址:https://top.aibase.com/tool/inpaint-we...
-
客观看待AI大模型在数字化转型中的地位和作用
“ AI大模型在数字化转型中的作用尚未突破《“以数据为中心的业务变革”之三种范式》中第三种范式的边界”。 自从OpenAI公司研发的机器人聊天程序ChatGPT在2022年11月30日发布以来,在全世界迅速带起了热潮。ChatGPT是AI大模型驱动的自...
-
2024年CIO的14项优先事项和趋势
GenAI将是2024年的最大技术趋势,也是董事会负责审查新工具、配置基础设施、准备应对新风险和利用新用户体验的CIO的优先事项。 这并不容易,因为大多数供应商都在添加新的GenAI功能,通常成本很高。CIO将需要为这些工具制定业务案例,以确定它们是能...
-
维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%
近日,来自斯坦福的研究人员发布了WikiChat——被称为首个几乎不产生幻觉的聊天机器人!...
-
Midjourney V6发布了,逼真画面登峰造极,不愧为最好的AI绘画
Midjourney V6昨天才说要来,下午就立马现身。速度之快,让人瞠目结舌!一系列惊艳绝伦的神奇图像纷纷爆出,光影效果简直达到了巅峰。尤其是他们主打的“你说得出,我就能画得出”。 Midjourney V6昨天下午突然发布了!Midjourney...
-
2024年八大关键技术趋势
1、更多的人将采用人工智能和机器学习 人工智能(AI 和机器学习(ML 不仅仅是流行语。我们日常使用的许多产品和服务的背后都是人工智能和机器学习,它们让我们的生活变得更轻松、更美好。 到2024年,许多风险投资家都在人工智能和机器学习上投入了大量资金,...
-
3 任务3 使用趋动云部署自己的stable-diffusion
使用趋动云部署自己的stable-diffusion 1 创建项目: 2 初始化开发环境实例 3 部署模型 4 模型测试 1 创建项目: 1.进入趋动云用户工作台,选择:当前空间,请确保当前所在空间是注册时系统自动生成的空间。 a...
-
肖仰华:走向千行百业的大模型
现如今,我们站在了大模型技术和产业发展的中场思考阶段。这个阶段的开启源于 ChatGPT 的诞生,它引发了广泛而深入的关注。尽管这种关注对于推动技术和产业的发展起到了至关重要的作用,但同时我们也看到了一系列问题的浮现。这些问题包括成本和价值的问题以及一些...
-
[AI绘画] 即插即用!SDXL+T2I-Adapters 高效可控的生成图片
标题:T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models 论文:https://arxiv....
-
配置 Stable Diffusion WebUI 纯 CPU 或核显绘画
(如有更新,见原文:https://blog.iyatt.com/?p=12345 1 前言 我笔记本电脑的独显上半年的时候烧掉了,所以只能用 CPU,折腾了一下午总算给配置出来了。我这里用的官方 Python,网上很多教程用 Anaconda(...
-
AIGC:【LLM(六)】——Dify:一个易用的 LLMOps 平台
文章目录 一.简介 1.1 LLMOps 1.2 Dify 二.核心能力 三.Dify安装 3.1 快速启动 3.2 配置 四.Dify使用 五.调用开源模型 六.接通闭源模型 七.在 Dify.AI 探索不同模型潜力 7.1 快速切...
-
使用Google大模型Bard(PaLM)理解时间序列预测模型ARIMA
使用Bard模型理解时间序列预测模型ARIMA Q: explains ARIMA model (注释:让Bard解释下时间序列预测模型ARIMA Q: explains the AR sub model in ARIMA model, gi...
-
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述
大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其...
-
ChatGPT、New Bing、文心一言、通义千问等 AI 工具到底哪个更AI? - 第二期
文章目录 前言 选手介绍 ChatGPT New Bing 文心一言 钉钉的文档AI 通义千问 文心一格 通义万相 测试开始 文案编写 ChatGPT New Bing 文心一言 钉钉的文档AI 通义千问 代码解读 ChatGPT...
-
美图AI视觉大模型MiracleVision奇想智能将向公众开放
1月2日,美图公司自研AI视觉大模型MiracleVision(奇想智能)通过《生成式人工智能服务管理暂行办法》备案,将面向公众开放。 美图AI视觉大模型MiracleVision(奇想智能)于2023年6月内测,为美图秀秀、美颜相机、Wink、美图设计室...
-
生成式人工智能泡沫将于2024年破灭
由于法律挑战、技术限制以及概念框架根本性转变的需要,生成式人工智能泡沫将在2024年破灭。 像ChatGPT这样的项目因其改变人类生活各个方面的潜力而闻名,但由于预期的破坏似乎难以捉摸,因此面临着审查。 随着技术行业寻求克服众多挑战,有必要进行重新调整...
-
FaceAiSwap官网体验入口 AI换脸服务免费使用地址
FaceAiSwap是一个先进的AI人脸交换服务,它允许用户将自己的脸部与喜欢的名人或朋友的脸部进行交换。使用这个服务非常简单:用户只需上传一张清晰的脸部照片,就能将自己的脸部替换到任何图片中。FaceAiSwap为免费用户每天提供 3 次免费交换机会。对...
-
年度最热AI应用TOP 50,除了ChatGPT还有这么多宝藏
百模齐发、AI工具乱杀的一年里,谁是真正赢家? ChatGPT访问量遥遥领先位居第一,但单次使用时长没超过平均线。 Midjourney访问量年度第四,但下滑量位居第二。 引爆AI绘画趋势的Stable Diffusion,年度访问量居然没进前20名?...
-
这是GPT-4变笨的新解释
变笨的本质是知识没进脑子。 自发布以来,曾被认为是世界上最强大的 GPT-4也经历了多场「信任危机」。 如果说今年早些时候那次「间歇式降智」与 OpenAI 重新设计 GPT-4架构有关,前段时间的「变懒」传闻就更搞笑了,有人测出只要告诉 GPT-4「现在...
-
突破Pytorch核心点,模型定义与搭建 !!
嗨,我是小壮! 咱们今儿来聊聊关于模型定义与搭建。很适合初学者! 在使用PyTorch进行深度学习时,首先需要了解的是如何定义和搭建模型。这块内容非常重要。 在PyTorch中,模型的定义通常通过创建一个继承自torch.nn.Module的类来完成。...
-
OpenVoice 官网体验入口 AI语音克隆软件app免费下载地址
OpenVoice是一个开源的语音克隆技术平台,能够准确克隆参考音色,生成包含多种语言和口音的语音。它的核心功能在于能够灵活控制语音风格,如情感、口音、节奏、停顿和语调等参数。此外,OpenVoice实现了零样本跨语言语音克隆,这意味着生成的语音和参考语音...
-
【个人首测】百度文心一言 VS ChatGPT GPT-4
昨天我写了一篇文章GPT-4牛是牛,但这几天先别急,文中我测试了用GPT-4回答ChatGPT 3.5 和 Notion AI的问题,大家期待的图片输入也没有出现。 昨天下午百度发布了文心一言,对标ChatGPT,录屏+无实机演示让百度股价暴跌。...