-
CVPR 2023 | 图像超分,结合扩散模型/GAN/部署优化,low-level任务,视觉AIGC系列
1、Activating More Pixels in Image Super-Resolution Transformer 基于Transformer的方法在低级别视觉任务中,如图像超分辨率,表现出了令人印象深刻的性能。Transformer的...
-
Ai换脸能把脸部变流畅吗?这3款AI换脸视频工具用起来
人工智能(AI)的迅猛发展彻底改变了我们生活的方方面面,其中之一就是AI换脸工具。这些工具采用了先进的计算机视觉技术和深度学习算法,如生成对抗网络(GAN ,能够在照片或视频中轻松交换一个人的面孔。 以下是几款好用的AI换脸视频工具: Swapstream...
-
Gemini偷师文心一言?这一局,百度给中国大模型找回了面子!
大数据产业创新服务媒体 ——聚焦数据 · 改变商业 在模型表现方面,百度文心一言、阿里通义千问、华为盘古、腾讯混元、科大讯飞星火等,都在说超过ChatGPT-3.5,马上要追上GPT-4,甚至在某些领域的表现超越了GPT-4。...
-
2024年十大网络技术预测
全球电信行业大咖对2024年的预测 虽然5G覆盖全球,人工智能重塑网络,数据中心发生变化,但于电信而言,前方的道路仍很复杂。消除数字鸿沟、防范复杂的欺诈行为、倡导可持续发展,同时谨慎采用新技术,这些都是2024年的优先事项。 随着生成式人工智能接管移动...
-
带你从零开始入门AI绘画神器Stable Diffusion
一、本地部署 Stable diffusion 1. 前言 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一个叫 Stable-Diffusion(简称 SD)。MJ 需要付费使用,而 S...
-
AI换脸视频怎么制作?Faceswapper.ai一键就能换脸
Faceswapper.ai 是一款专为追求快速面部交换的用户设计的高效工具。通过添加精致的动画层,该工具能够赋予普通图像诱人的魅力,而其主要优势在于其出色的简单性。 使用Faceswapper.ai,用户只需轻松上传照片,接下来的转换过程完全由界面负责协...
-
大模型+机器人,详尽的综述报告来了,多位华人学者参与
大模型的出色能力有目共睹,而如果将它们整合进机器人,则有望让机器人拥有一个更加智能的大脑,为机器人领域带来新的可能性,比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。 预训练的大型语言模型(LLM)、大型视觉 -...
-
秒懂AI-深度学习四种常用激活函数:Sigmoid、Tanh、ReLU和Softmax
深度学习中的激活函数是神经网络中至关重要的组成部分,它们为神经网络引入非线性特性,使其能够更好地学习和模拟复杂的输入输出关系。激活函数的选择和使用对于神经网络的性能和训练效果具有重要影响。 本文将介绍四种常用的激活函数:Sigmoid、Tanh、ReLU...
-
人脸识别技术演进:从几何算法到深度学习的深度剖析
本文全面探讨了人脸识别技术的发展历程、关键方法及其应用任务目标,深入分析了从几何特征到深度学习的技术演进。 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实...
-
Python+AI实现AI绘画
? 运行环境:Python ? 撰写作者:左手の明天 ? 精选专栏:《python》 ? 推荐专栏:《算法研究》 ?#### 防伪水印——左手の明天 ####? ? 大家好???,我是左手の明天!好久不见? ?今天分享py...
-
AI视野:必应推出GPT-4Turbo模型;抖音测试“AI搜”功能;小红书内测AI聊天机器人;OpenAI计划新一轮融资
????大模型动态 必应推出GPT-4Turbo模型 微软推出Bing Chat的最新模型,GPT-4Turbo,为用户提供更准确和最新的信息。目前仅限部分用户试用,使用方法需通过检查资格确认。 阿里团队推新AI模型I2VGen-XL 视频合成领域迎来...
-
一篇综述,看穿基础模型+机器人的发展路径
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。 近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
Stable Diffusion - Easy Diffusion 图像生成工具的环境配置
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://blog.csdn.net/caroline_wendy/article/details/131524075 版本v2.5.41 Stab...
-
阿里团队推新AI模型I2VGen-XL:单张静止图像就能生成高质量视频
视频合成最近取得了显著的进步,这得益于扩散模型的快速发展。然而,它在语义准确性、清晰度和时空连续性方面仍然存在挑战。它们主要源于文本-视频数据的稀缺性和视频的复杂固有结构,使得模型难以同时确保语义和定性的卓越性。 阿里巴巴、浙江大学和华中科技大学的研究人员...
-
从新手到高手:AI绘画实战中的Midjourney
? 个人网站:【 海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的:?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 随着人工智能(AI)技术的飞速发展,AI绘画逐渐成为艺术领域的一项令人瞩目的技术。本文将...
-
LLaMA系列模型
1.LLama 1.1 简介 Open and Efficient Foundation Language Models (Open但没完全Open的LLaMA 2023年2月,Meta(原Facebook)推出了LLaMA大模型,使用了1.4...
-
Stable diffusion的一些参数意义及常规设置
在线stabel Diffusion模型 https://huggingface.co/spaces/stabilityai/stable-diffusion随机种子 seed 如果想要同一个文本提示,生成多次都是同一图像,可以设置一个随机种子,类似于...
-
实力强的大模型都有哪些超能力?
前几日,人工智能研究公司OpenAI CEO山姆·奥特曼(Sam Altman)在谈及人工智能这项技术的潜力以及人们对它的担忧时,曾表示“AI发展速度快得吓人,就像停不下来的龙卷风。”可见,人工智能正在以它超前的速度改变世界。 在经历了年初人工智能之大...
-
【达摩院OpenVI】AIGC技术在图像超分上的创新应用
团队模型、论文、博文、直播合集,点击此处浏览 一、背景 近10年来,深度学习技术得到了长足进步,在图像增强领域取得了显著的成果,尤其是以GAN为代表的生成式模型在图像复原、老片修复,图像超分辨率等方面大放异彩。图像超分辨率是视频增强方面,用...
-
开创全新通用3D大模型,VAST将3D生成带入「秒级」时代
生成式 AI 在3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。 传统3D 建模涉及游戏、影视、建筑等多个行业,普遍依赖专业人员手动操作,生产周期短则几天,多则以月为单位,单个3D 模型的创建成本至少需要几千元。生成式 AI 技术在2D 图...
-
【分享】AI绘画提示词生成器工具
哈喽,大家好,我是木易巷~ 今天,木易巷给大家带来AI绘画提示词生成器工具---PromptoMANIA。 PromptoMANIA【AI绘画提示词生成器工具】 介绍 PromptoMANIA PromptoMANIA是一个聚焦于人工...
-
全面合作:传媒业巨头与OpenAI寻求共赢
12月13日,OpenAI与欧洲最大的数字出版公司施普林格Axel Springer宣布战略合作。这是继媒体联盟一再发起抵制AI厂商的抗议以来,首例传媒巨头与AI厂商从版权、技术及商业模式上的全方位战略合作。 本文梳理了此次合作带给新闻业的重要意义,与合作...
-
文心一言AI大模型,前端接入
文心一言AI大模型,前端接入 一、参考接口资料 模型广场:https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list 我的应用:https://console.bce.bai...
-
大语言模型训练数据常见的4种处理方法
本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》,作者: 码上开花_Lancer。 大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然,截止到2023 年9 月为止,还...
-
逆天!真实可控、可拓展,自动驾驶仿真平台LightSim上新
最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。L...
-
Stable Diffusion - Stable Diffusion WebUI 支持 SDXL 1.0 模型的环境配置
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132056980 SDXL 1.0 版本 是 Stable Dif...
-
数据治理与大模型一体化实践
降本增效方面,以机器学习团队的构成为例,滴普科技Deepexi产品线总裁柏海峰介绍道:“传统机器学习或者说小模型的技术落地,对人才的要求很高,但企业往往没有意识到这个问题。具体来说,一般需要构建一个综合性的团队即数据科学团队,团队中需要数据开发工程师、...
-
DALL·E2(unCLIP)、Stable Diffusion、IS、FID要点总结
DALL·E 1 DALL·E 1可以看成是VQ-VAE和文本经过BPE编码得到的embedding AE(Auto Encoder) encoder decoder结构,AE在生成任务时只会模仿不会创造,所有有了后面的VAE VAE(Var...
-
编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源
开源「代码大模型」来了! UIUC清华团队的研究人员发布了Magicoder,不到7B参数,就能在代码生成领域与顶级代码模型不相上下。 值得一提的是,Magicoder的代码、权重和数据,毫无保留完全开源。 论文地址:https://arxiv.org...
-
UIUC清华联手发布全新代码大模型Magicoder 不到7B参数
在代码生成领域,UIUC和清华合作发布了Magicoder,这一全新的大型语言模型仅使用了7B参数,却能与顶级模型媲美,并以全面开源的方式分享了其代码、权重和数据。Magicoder的关键在于采用了OSS-INSTRUCT方法,该方法通过从开源代码中获取灵...
-
谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐
谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作,提出了一种名为PixelLLM的智能模型,旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发,尤其是婴儿描述其视觉环境的方式,包括手势、指向和命名。 Pix...
-
Midjourney指令操作、promt框架、参数设置教程
引言:基于Chatgpt的应用如雨后春笋,这波浪潮正当时。最近在摸索图片生成有价值的应用场景,使用过程中整理了一些指令秘籍,一同分享出来。 1、原理 Midjourney的人工智能绘画技术基于GPT-3.5模型,使用了先进的神经网络算法,通过输入简单...
-
重塑未来数字格局的五大技术趋势
科技改变了世界,这是一个毫无争议的说法。从古人犁地到今天的印刷机再到个人电脑,先进的技术有能力从根本上重塑世界和我们的生活方式。过去几十年的许多变化使我们认识到,我们社会中一些最具变革性的变化是由软件实现的。数字化转型不仅仅是一个流行语,而是一个现实。...
-
【Midjourney入门教程3】写好prompt常用的参数
文章目录 1、图片描述词(图片链接)+文字描述词+后缀参数 2、权重划分 3、后缀参数 版本选择:--v 版本风格:--style 长宽比:--ar 多样性: --c 二次元化:--niji 排除内容:--no --stylize --see...
-
快手 Dragonfly 策略引擎的设计与应用
一、问题与挑战 1、问题背景 从 2018 年开始,快手的整个业务呈现快速发展的状态,团队也在快速扩张中。在过去的五年中,DAU 从 1 亿增长至 3.76 亿。在 2021 年,快手的 DAU 已经超过了 3 亿。主要推荐场景也从早期的发现页、关注...
-
文心一言的优缺点分析及改进思路
随着人工智能技术的不断发展,越来越多的人们开始关注如何利用人工智能技术提高写作效率和质量。而文心一言作为一款基于深度学习算法的智能写作工具,已经成为日常写作中广泛使用的一种工具。但是,任何一种工具都有其优点和缺点,在使用文心一言时也需要认真考虑它的优缺点,...
-
【文生图】Stable Diffusion XL 1.0模型Full Fine-tuning指南(U-Net全参微调)
文章目录 前言 重要教程链接 以海报生成微调为例 总体流程 数据获取 POSTER-TEXT AutoPoster CGL-Dataset PKU PosterLayout PosterT80K Movie & TV Series...
-
AIGC产业研究报告2023——三维生成篇
定义 人工智能三维生成是指利用深度神经网络学习并生成物体或场景的三维模型,并在三维模型的基础上将色彩与光影赋予物体或场景使生成结果更加逼真。在应用中,生成物体或场景的三维模型称为三维建模,生成三维模型的色彩与光影称为三维渲染。 主要类型 三维生成...
-
AI首次攻克难倒陶哲轩数学难题,DeepMind里程碑算法登Nature!LLM搜代码自我进化
上限集问题,是困扰数学家们多年的开放性问题。 著名数学家陶哲轩,就曾将上限集问题描述为自己最喜欢的开放性问题。 陶哲轩博客 而大语言模型,竟然在这个问题上做出了新发现。 今天,Google DeepMind、威斯康星大学麦迪逊分校和里昂大学的研究人员联...
-
UC伯克利DeepMind等联合发布真实世界模拟器,打破虚实边界
真实世界模拟器来啦! 还在发愁训练出的大模型无法适应真实的物理世界吗? AI Agent想要进入我们的生活还有多远的距离? ——UC伯克利、谷歌DeepMind、MIT和阿尔伯塔大学的研究人员告诉你答案。 在NeurlPS 2023上,研究人员将展示他们...
-
ChatGPT研究(三)——AIGC多模态交互功能,奠定多场景商用基础
✏️写作:个人博客,InfoQ,掘金,知乎,CSDN ?公众号:进击的Matrix ?特别声明:创作不易,未经授权不得转载或抄袭,如需转载可联系小编授权。 前言 最近ChatGPT,想必大家已经是耳熟能详了,一度认为ChatGPT的到来是...
-
突发!GPT-4.5泄露传闻:是圣诞的礼物,还是传言的迷雾?
刚刚,一颗潜在的AI圈震撼弹——OpenAI 的 GPT-4.5版本——似乎无声地滑入公众的视线。 这份所谓的“泄露”信息,以及它预示的技术突破究竟意味着什么,目前仍是一个谜。 背景信息:GPT的演变 在深入泄露的细节之前,让我们简要回顾一下 GPT 模型...
-
【文心一言】使用飞桨 AI Studio 快速搭建,看图识猜成语应用
目录 一、背景 二、实践 三、创建应用 3.1、零代码开发 3.2、应用名称 3.2、模型训练 3.3、开始训练 四、应用部署 4.1、发布项目 4.2、搜索应用 4.3、应用部署 4.4、获取令牌 4.4、导入依赖 4.5、配置CO...
-
DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解
作为今年 AI 圈的顶流,大型语言模型(LLM)擅长的是组合概念,并且可以通过阅读、理解、写作和编码来帮助人们解决问题。但它们能发现全新的知识吗? 由于 LLM 已被证明存在「幻觉」问题,即生成与事实不符的信息,因此利用 LLM 来做可验证的正确发现是一...
-
真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了
最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。L...
-
人工智能中的文本分类:技术突破与实战指导
在本文中,我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用,以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用,旨在提供对文本分类技术深入理解的全面视角。 关注TechLead,分享A...
-
2023.12.12最新源码及资源:使用Python构建与百度大模型(包括文心一言在内的18个语言模型)的交互式界面!!
#ps:12.12修复bug,部分模型不能回应的问题,资源已更新! 在当前人工智能领域,通过与机器进行智能对话的能力变得越来越重要。本文将介绍如何使用Python编程语言和Tkinter库构建一个交互式界面,使用户能够与百度大模型进行智能对话,展...
-
ChatGPT和文心一言的优缺点比较
ChatGPT和文心一言都是自然语言生成技术的代表,下面是它们的优缺点比较: ChatGPT的优点: 自由度高:ChatGPT生成的文本与给定的话题没有紧密的关联,可以灵活地生成多种不同的文本。 多样性高:ChatGPT可以生成多样性高的文本,因为其...
-
AI绘画-Midjourney基础1-突破想象的界限:掌握文本引导的图像生成技巧
Midjourney是一款 AI 绘画工具,可以根据你的提示(本文中称为 prompt)创作出各种图像。你只需要在Discord上和一个机器人聊天,就可以用简单的命令来控制它。目前已不支持免费试用,可以选择付费计划来获得更多功能和优势。 目前 Midjo...
-
AI视野:谷歌Gemini Pro开放;文心一言插件商城上线;谷歌图像生成模型Imagen2发布;阿里推虚拟试穿技术Outfit Anyone
???AI新鲜事 谷歌Gemini Pro开放 谷歌Gemini Pro大模型在研究基准测试中表现优异,支持32K上下文窗口的文本输入和生成功能,向Vertex AI云计算客户和AI Studio开发人员开放,提供多种功能和SDK,为构建AI应用程序提供更...