-
解构百度智能云千帆AppBuilder,预见下一代大模型应用
嘉宾|百度智能云技术委员会主席 孙珂 撰稿 | 云昭 2023,如果将全球科技比作一首雄浑热烈的交响曲,那么大模型无疑成为了最为激越人心的主旋律。而与海外大模型的几大巨头你追我赶的激烈竞争叙事不同,国内的大模型发展与创新的轨迹方向,似乎看百度就够了。...
-
stable diffusion(安装以及模型的初步使用)
本机的配置 能跑模型,本地也跑过一点Lora训练的脚本,看看几个效果: 以上的都是配合huggingface有的模型结合civitai上的Lora模型在本地跑出来的图片,自己本地训练的Lora太拉闸了,就不放上来了…… 1....
-
科技部发文规范AI使用 科研人员禁用AIGC直接生成申报材料
据科学技术部消息,科技部监督司近日编制印发《负责任研究行为规范指引(2023)》,提出不得使用生成式人工智能(AIGC 直接生成申报材料,不得将生成式人工智能列为成果共同完成人,同时强调科研人员应把科技伦理要求贯穿到研究活动的全过程。 《指引》适用对象包...
-
量子计算如何改变人工智能
量子计算和人工智能是当今时代最具颠覆性的两项技术。这两种技术开始以有趣的方式融合。例如,量子计算机可以比传统计算机更快、更有效地训练人工智能模型,从而开发出更强大、更智能的人工智能系统。量子算法对图形处理单元(GPU 硬件表现出天然的亲和力,因为它们能...
-
探索Whisper语音识别
问题一:python多版本切换 背景:有了anaconda环境 还有一个c盘的不知道什么东西 我准备下载一个python3.9.9 去官网 然后安装,安装之前一定要把原来的python卸载干净。 3.9.9安装不上,我用3.10...
-
Mickey-1928官网体验入口 AI米老鼠生成工具免费下载地址
Mickey-1928是一款基于Stable-Diffusion-xl模型微调的AI工具,专注于生成迪士尼 1928 年前的经典动画角色。这款工具使用了包含《小飞象》、《汽船威利号》和《疯狂的高卢》等动画中的 96 张静态画面作为训练数据集。Mickey-...
-
2024年AI还能帮你干什么?这十个趋势必须关注
元旦节收假,你身心都复工了吗? 新的一年,有没有跟我一样,既想打工挣钱花,又想从具体任务中解放出来的?最好是能在新的一年,实现个人能力的极大增强…… 所以今天,咱们就好好说一说,新的一年里,怎样能让AI多给自己帮帮忙(doge)。 或许你已经关注到了,...
-
AI声音克隆软件app免费使用地址 Clone-Voice体验入口
Clone-Voice 是一款具有Web界面的先进声音克隆工具,它可以使用任何人类音色,将文字转换为使用该音色的声音,或者将一个声音转换成另一个声音。Clone-Voice支持中文、英语、日语、韩语、法语、德语、意大利语等 16 种语言,且用户可以在线从麦...
-
Deepin 深度操作系统推出“看图 AI 插件”,支持设备端“图像上色”“转换风格”等八大功能
1 月 3 日消息,据 deepin 深度操作系统官方新闻稿,deepin 近日推出了一款“看图 AI 插件”,用户在安装后即可在设备端体验 8 种“AI 修图”功能: 图像上色:为黑白图像或单色图像自动添加颜色 提升分辨率:增加图像的像素密度,...
-
基于whisper和whisperx的语音视频和字幕对齐
环境的安装 创建py310虚拟环境,需要安装Anaconda的Python环境。 Python初学者在不同系统上安装Python的保姆级指引 Win10+Python3.9+GPU版pytorch环境搭建最简流程 Python虚拟环境的安装和使用...
-
讯飞配音体验入口在哪 AI声音克隆软件推荐
讯飞配音是一款基于科大讯飞的人工智能语音技术的配音软件,它可以将文字转化为自然流畅的人声,支持多语种、多方言和中英混合,可灵活配置音频参数。讯飞配音的体验入口在哪呢,这里我们来看下讯飞配音的官方体验入口。 >>>点击前往 讯飞配音 官方...
-
科技部发文规范 AI 使用,禁用 AIGC 直接生成申报材料
IT之家 1 月 3 日消息,科技部监督司上个月编制印发《负责任研究行为规范指引(2023)》,《指引》从研究选题与实施、数据管理、成果署名、同行评议、伦理审查、监督管理等 11 个方面,对科研人员和科研机构、高等学校、医疗卫生机构、企业等(以下统称“...
-
AI修图小助手Inpaint wechat微信小程序上线 可选定图片区域进行消除修复
Inpaint_wechat 微信小程序已经上线了!这是一款基于微信AI能力的微信小程序,它可以实现图片选定区域的消除修复功能,并且是纯客户端实现,无需服务端的支持。 体验地址:https://top.aibase.com/tool/inpaint-we...
-
客观看待AI大模型在数字化转型中的地位和作用
“ AI大模型在数字化转型中的作用尚未突破《“以数据为中心的业务变革”之三种范式》中第三种范式的边界”。 自从OpenAI公司研发的机器人聊天程序ChatGPT在2022年11月30日发布以来,在全世界迅速带起了热潮。ChatGPT是AI大模型驱动的自...
-
FastCut软件体验入口 AI视频剪辑软件推荐
FastCut是一款视频剪辑软件,它可以根据音乐节奏自动剪辑视频,让你轻松创建出精彩的视频作品。FastCut的体验入口在哪呢,这里我们来看下FastCut的官方体验入口。 >>>点击前往 FastCut 官方体验入口<<&...
-
基于Python的图像预处理完整指南
你是否曾在机器学习或计算机视觉项目中遇到过质量较差的图像问题?图像是许多AI系统的生命线,但并非所有图像都是相同的。在训练模型或运行算法之前,通常需要对图像进行一些预处理以获得最佳结果。在Python中进行图像预处理将成为您的新伙伴。 在本指南中,您将...
-
Nudify.co官网体验入口 AI图片去衣应用免费下载地址
Nudify.co是一款利用AI技术从图片中移除衣物的应用。这款工具的使用非常简单方便,用户只需选择并上传想要处理的图片,即可快速查看去衣后的效果,并有选项下载保存处理后的图片。 点击前往Nudify.co官网体验入口 Nudify.co的目标用户群...
-
谷歌2023年发布的七大人工智能功能
撰稿丨云昭 出品 | 51CTO技术栈(微信号:blog51cto) 谷歌见证了Gemini发布以来最好的一年,以及今年推出的全新功能。人工智能的突破、量子计算的进步以及对可持续发展的持续承诺突出了该公司的创新努力。 今年发布的研究论文以及对医疗保健技术...
-
Text2Immersion官网体验入口 文本到3D沉浸式场景生成AI工具免费下载地址
Text2Immersion是一个创新的工具,专门用于从文本提示生成高质量的3D沉浸场景。该方法首先使用预训练的2D扩散和深度估计模型逐步生成高斯云,然后通过精炼和插值处理来增强生成场景的细节。与传统方法相比,Text2Immersion能够创建包含多种物...
-
Sih.Ai换装入口在哪 AI换装软件推荐
Sih.Ai是一个自由的AI图像重绘服务平台,它可以让您轻松地修改和生成图像。Sih.Ai的体验入口在哪呢,这里我们来看下Sih.Ai的官方体验入口。 >>>点击前往 Sih.Ai 官方体验入口<<< 它有以下几个功能...
-
2024年CIO的14项优先事项和趋势
GenAI将是2024年的最大技术趋势,也是董事会负责审查新工具、配置基础设施、准备应对新风险和利用新用户体验的CIO的优先事项。 这并不容易,因为大多数供应商都在添加新的GenAI功能,通常成本很高。CIO将需要为这些工具制定业务案例,以确定它们是能...
-
BetterYeah AI体验入口 企业级AI应用开发平台免费使用地址
BetterYeah AIAgent是一个高级的企业级AI应用开发平台,专注于构建业务专家级的AI工作助理。这个平台内置了多种成熟的模板,功能强大而且开箱即用,支持快速应用落地。它还支持私有化部署,确保企业数据的安全性。BetterYeah AI可以一键解...
-
2024年无线技术将如何改善连通性、效率和消费者体验
在2024年,无线技术预计将带来多方面的改善,提升连通性、效率和消费者体验,将改变无线技术在全球社区和企业中的使用方式,包括改善连接性、效率和新的消费者体验。 在未来,10GBPS的速度将是无处不在的 互联网服务提供商(isp 提供比以往更快的互联网速...
-
全球首家AI餐厅开业 机器人全自动做汉堡和炸薯条
全球首家全自动、由人工智能驱动的餐厅CaliExpress by Flippy于去年12月在南加州开业。在这家餐厅,机器人负责烹饪汉堡和炸薯条。 来到餐厅的客人下单后,可以观看机器人从头到尾准备饭菜,顾客还可以对订单进行定制。 这家餐厅是由科技公司 Ca...
-
AAAI 2024 Fellow公布,清华大学朱军教授入选
AAAI(Association for the Advancement of Artificial Intelligence)是国际人工智能领域最权威的学术组织之一,Fellow 是该学会给予会员的最高荣誉,仅颁给对人工智能做出「非同寻常的卓越贡献者」...
-
阿里AI项目DreamTalk开源 可让人物头像说话
阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。 模型下载地址:https://huggingface.co/damo-vilab/dreamtalk 项目地址:htt...
-
GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发
如今,GPT-4 Vision在语言理解和视觉处理方面展现出了非凡的能力。 然而,如果想在不影响性能的前提下,寻求具有成本效益的替代方案,开源方案就蕴藏着无限可能。 国外的一位开发者Youssef Hosni为大家奉上了三种GPT-4V的开源替代方案,可...
-
AI识别出地震先兆信号?机器学习发现数据神秘关联,人类有望预测地震
最近一段时间,世界各地地震频发。 就在1月1日,日本突发里氏7.6级的地震,随后陆续有灾情传出。据统计,目前至少已有62人死亡。 而下面这个问题,也再一次被提起:人类究竟什么时候能及时预测地震呢? 别急,已经在进步了。 现在,在用AI和其他技术及时预测...
-
维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%
近日,来自斯坦福的研究人员发布了WikiChat——被称为首个几乎不产生幻觉的聊天机器人!...
-
微软官方 Copilot AI 编程训练营第一天精华总结
阿七参加的微软官方组织的 Copilot AI 编程训练营开始了,这是第一天。 GitHub Copilot 官方统计,使用 GitHub Copilot 的开发者基本上能极大的提升编码效率、减少重复性代码编码时间且能更加专注于主线任务。 不管这个...
-
高情商的NPC来了,刚伸出手,它就做好了要配合下一步动作的准备
在虚拟现实、增强现实、游戏和人机交互等领域,经常需要让虚拟人物和屏幕外的玩家互动。这种互动是即时的,要求虚拟人物根据操作者的动作进行动态调整。有些互动还涉及物体,比如和和虚拟人物一起搬动一把椅子,这就需要特别关注操作者手部的精确动作。智能、可交互的虚拟人...
-
Midjourney V6发布了,逼真画面登峰造极,不愧为最好的AI绘画
Midjourney V6昨天才说要来,下午就立马现身。速度之快,让人瞠目结舌!一系列惊艳绝伦的神奇图像纷纷爆出,光影效果简直达到了巅峰。尤其是他们主打的“你说得出,我就能画得出”。 Midjourney V6昨天下午突然发布了!Midjourney...
-
百度大模型这一年:文心一言国内首个用户破亿,飞桨开发者超千万
文心一言用户规模破1亿,飞桨的开发者数量达到1070万。 只用短短两个月,文心大模型4.0整体效果又提升了32%。 2023年12月28日,在刚刚过去的 WAVE SUMMIT+2023深度学习开发者大会上,百度揭幕了文心大模型与深度学习平台飞桨的一系列新...
-
2024年八大关键技术趋势
1、更多的人将采用人工智能和机器学习 人工智能(AI 和机器学习(ML 不仅仅是流行语。我们日常使用的许多产品和服务的背后都是人工智能和机器学习,它们让我们的生活变得更轻松、更美好。 到2024年,许多风险投资家都在人工智能和机器学习上投入了大量资金,...
-
M2UGen体验入口 AI多模态音乐生成框架免费下载地址
M2UGen是一款结合大语言模型的多模态音乐理解和生成框架,旨在协助用户进行音乐创作。它能同时完成音乐理解和多模态音乐生成任务,为音乐创作、音乐理解研究和音乐应用开发提供了强大的支持。 点击前往M2UGen体验入口 M2UGen适用于哪些用户? M2U...
-
保姆级教程:从0到1使用Stable Diffusion XL训练LoRA模型 |【人人都是算法专家】
Rocky Ding 公众号:WeThinkIn 写在前面 【人人都是算法专家】栏目专注于分享Rocky在AI行业中对业务/竞赛/研究/产品维度的思考与感悟。欢迎大家一起交流学习? 大家好...
-
MidReal AI更新Beta版本 官网上线推荐小说页面
AI小说生成工具MidReal AI最新更新了Beta版本,不仅更新了模型,还增加了许多新功能。新模型生成的内容更有逻辑,更连贯。 同时,官网上线了小说展厅,用户可以在官网上查看推荐的小说,比在Discord上阅读更加舒适。此外,还增加了新功能,比如使用“...
-
3 任务3 使用趋动云部署自己的stable-diffusion
使用趋动云部署自己的stable-diffusion 1 创建项目: 2 初始化开发环境实例 3 部署模型 4 模型测试 1 创建项目: 1.进入趋动云用户工作台,选择:当前空间,请确保当前所在空间是注册时系统自动生成的空间。 a...
-
MidReal官网体验入口 AI文本冒险游戏平台免费使用地址
MidReal是一个基于先进AI技术的文本冒险游戏平台。该平台具有强大的长篇叙事能力和近乎无限的记忆能力,能够根据玩家的选择生成连贯、沉浸式的故事剧情。玩家可以在多种世界观和场景中自由选择角色,创造独特的冒险体验。 点击前往MidReal体验入口 适用人...
-
肖仰华:走向千行百业的大模型
现如今,我们站在了大模型技术和产业发展的中场思考阶段。这个阶段的开启源于 ChatGPT 的诞生,它引发了广泛而深入的关注。尽管这种关注对于推动技术和产业的发展起到了至关重要的作用,但同时我们也看到了一系列问题的浮现。这些问题包括成本和价值的问题以及一些...
-
AI智能写作助手:你的私人写作教练,助你成就写作梦想
在这个信息爆炸的时代,每个人都有无尽的想法需要表达,每个人都有一颗隐藏的创作之心,等待被唤醒。但是,写作总是伴随着挑战,怎样才能突破困境,实现自己的写作梦想呢?答案就是——智能写作助手。 超凡写手,一款由榕诗科技AI公司开发的智能写作工具,致力于将最新的...
-
诺贝尔奖得主警告年轻一代不要学习STEM,因为可能被AI取代
近日,诺贝尔经济学奖得主Christopher Pissarides向年轻一代发出警告,称考虑学习科学、技术、工程和数学(STEM)的人应重新考虑。作为伦敦经济学院的教授,Pissarides认为,随着AI接管更多分析性任务,未来将更加重视同理心和创意技能...
-
突破Pytorch核心点,CNN !!!
哈喽,我是小壮! 创建卷积神经网络(CNN),很多初学者不太熟悉,今儿咱们来大概说说,给一个完整的案例进行说明。 CNN 用于图像分类、目标检测、图像生成等任务。它的关键思想是通过卷积层和池化层来自动提取图像的特征,并通过全连接层进行分类。 原理 1.卷...
-
[AI绘画] 即插即用!SDXL+T2I-Adapters 高效可控的生成图片
标题:T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models 论文:https://arxiv....
-
苹果ferret官网体验入口 Apple AI模型工具免费下载地址
Appleml-ferret是一个先进的端到端机器学习语言模型(MLLM),专门设计用于在多模态环境中进行精准定位。它结合了混合区域表示和空间感知的视觉采样器,支持对细粒度和开放词汇的引用和定位。此外,ml-ferret还包含了包括约 110 万个样本的G...
-
4D 毫米波雷达SLAM 方案调研
本文经自动驾驶之心公众号授权转载,转载请联系出处。 前言 Image Radar即4D 毫米波雷达,它输出3D位置+径向速度,相对于传统的3D毫米波雷达(2D位置+速度)多了一维高度信息输出。Image Radar具备传统3D雷达所有的特点,同时弥补了...
-
配置 Stable Diffusion WebUI 纯 CPU 或核显绘画
(如有更新,见原文:https://blog.iyatt.com/?p=12345 1 前言 我笔记本电脑的独显上半年的时候烧掉了,所以只能用 CPU,折腾了一下午总算给配置出来了。我这里用的官方 Python,网上很多教程用 Anaconda(...
-
虾壳ChatAi体验入口 AI智能聊天机器人免费使用地址
虾壳ChatAi是一款功能全面且交互自然的智能聊天机器人。它能够进行闲聊、提问回答、情感交流等多种交互形式,使用简单便捷,且完全免费。虾壳ChatAi具备强大的自然语言处理能力,能够理解用户的意图并进行有效的沟通。它能够应用于多种场景,包括娱乐、学习、生活...
-
AI智能写作算法:揭秘黑科技,无所不能的写作能力,真实度高到爆表
敬爱的读者们,您好!我叫老李,今天很愿意为您揭晓有关Ai智能写作算法的神秘面纱。此项技术想必您都有所耳闻,却对其强大之处知之甚少。没关系,接下来就让我带您领略这种前沿科技的独特魅力!期待与您共同发现更多精彩内容! 【1.算法背后的黑科技】 首先,让我们...
-
MyShell发布开源AI语音克隆工具OpenVoice,瞄准语音模仿领域
MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院(MIT)、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效的方法,可几乎即时克隆用户的语音,并使用明显...