-
爆火《幻兽帕鲁》被指用AI缝合宝可梦,开发者自曝传奇经历:是人类的奇迹
4天卖出600万份,爆火游戏《幻兽帕鲁》最高180万人同时在线,直接登顶。 这个成绩,甚至在整个Steam游戏平台历史上也能排到第二,连平台自家王牌CS2都被挤下去了。 同时,玩家好评率也高达93%。 《幻兽帕鲁》为什么能叫好又叫座? 借鉴了“全球最赚...
-
Stable Diffusion——尝试如何正确的使用【AnimateDiff】生成动图——4种方法测试
测试方案1、传统生成图片方案 给的提示词与正常生成图片的操作一样。 封面图片生成信息:种子(654742741 Celebrity face, jet black long hair, beautiful woman, wearing...
-
画个框、输入文字,面包即刻出现:AI开始在3D场景「无中生有」了
现在,通过文本提示和一个2D 边界框,我们就能在3D 场景中生成对象。 看到下面这张图了没?一开始,盘子里是没有东西的,但当你在托盘上画个框,然后在文本框中输入文本「在托盘上添加意大利面包」,魔法就出现了:一个看起来美味可口的面包就出现在你的眼前。 房间...
-
使用SPIN技术对LLM进行自我博弈微调训练
2024年是大型语言模型(llm 的快速发展的一年,对于大语言模型的训练一个重要的方法是对齐方法,它包括使用人类样本的监督微调(SFT 和依赖人类偏好的人类反馈强化学习(RLHF 。这些方法在llm中发挥了至关重要的作用,但是对齐方法对人工注释数据有的大...
-
扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力
Pika北大斯坦福联手,开源最新文本-图像生成/编辑框架! 无需额外训练,即可让扩散模型拥有更强提示词理解能力。 面对超长、超复杂提示词,准确性更高、细节把控更强,而且生成图片更加自然。 效果超越最强图像生成模型Dall·E 3和SDXL。 比如要求图片...
-
MIT研究:AI尚不会取代你的工作,因为它还是太昂贵了
随着人工智能技术的飞速发展,人们对工作安全性的担忧也逐渐升温。然而,麻省理工学院(MIT)的一项新研究表明,目前部署这项技术的成本可能使得雇主更倾向于保留现有员工,至少在当前情况下是这样。 通常人们考虑到AI替代工作时,更多关注技术在执行人类任务方面的表现...
-
2024年爆火视频制作SAAS开源系统--可生成AI告白/新年祝福/宣传片等!
为什么我们要做一个这样的产品? 最近一段时间,经常可以看到一些直播间,通过直播播放夸张的表白、生日祝福、豪车祝福等视频,从而获取了大量的人气。然后再通过引导粉丝刷礼物就可以制定专属视频来实现变现,直播间流量非常好做,停留很高,转化成交率高达百分之九十! 当...
-
AIGC神器 Midjourney 强势更新!逼真到令人发指!文心一言紧跟其后
AI的发展之迅速,最近大家都应该看到了吧。 到处都充斥着关于AI的各种话题讨论 甚至有不少朋友有了逆反心理,看到AI就烦 但是作为一个AI 从业者,小皮可不能厌倦 今天就给大家整理了近期关于AI发展的新动向 一、国外的AI绘画已经可以精确到手部细...
-
微软组建GenAI团队,专注于构建更小、更便宜的人工智能模型
据The Information报道,微软正在组建一个名为GenAI的团队,该团队的目标是开发更小、更便宜的人工智能模型。这些模型将专注于语言模型,类似于OpenAI的GPT-4等大型语言模型(LLM),但它们将使用更少的计算资源。 图源备注:图片由AI...
-
酷开科技凭借AIGC技术打造从产品到运营到生态的范本
近日,酷开科技成功挑战“全球最多人同时线上和线下开箱”吉尼斯纪录,为中国品牌出海打样。酷开科技,除了硬件上的实力,更有软件上的硬核。酷开科技之所以能够从中国OTT行业独角兽走向海外市场“开疆拓土”,是基于创新的AI推荐算法和AIGC技术、强大的自动化智能运...
-
多用户数据检索:LangChain技术指南与案例分析
作者 | 崔皓 审校 | 重楼 摘要 文章探讨了如何确保不同用户数据的隔离,并提供灵活的配置选项以适应各种检索需求。 文章首先介绍了多用户数据检索的背景和挑战,包括数据权限管理、检索系统灵活性和用户体验问题。接着进行了技术分析,特别强调了使用Pinec...
-
万字总结 | 2023大模型与自动驾驶论文走马观花
本文经自动驾驶之心公众号授权转载,转载请联系出处。 2023年已经匆匆过去大半,不知各位自动驾驶小伙伴今年的工作生活情况是否顺利呢?高阶ADAS方案量产了吗?新的文章和实验进展又是否顺利呢?今天给大家总结了2023年前后的一些自动驾驶结合大模型的开创性...
-
谷歌取消与AI数据公司Appen的合同,曾帮助训练Bard等产品
谷歌公司宣布终止与澳大利亚数据公司Appen的合同,后者曾为Bard、Search等谷歌产品提供大型语言模型AI的训练。这一决定是谷歌为评估和调整其在Alphabet旗下众多供应商伙伴关系的持续努力的一部分,以确保其供应商运营的最大效率。据The Verg...
-
北京国际电影节AIGC电影单元;提示工程最佳实践;手把手教你构建基于RAG的LLM应用;多伦多大学AI对齐最新课程;国产大模型行研能力测评 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? Runway AIFF 2024 | 第二届AI电影节,作品提交进入50天倒计时 https://aiff.runwayml.com...
-
迈向分割的大一统!OMG-Seg:一个模型搞定所有分割任务
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者个人思考 图像分割已经从单任务分割走到了语义分割、实例分割、全景分割三种分割任务的统一;大模型以及多模态的发展又带来了文本和图像统一,使得跨模态端到端成为可能;追求更高级、更全面...
-
1分钟复刻明星语音,这家AI创企开年跻身独角兽
2024年第一个月,又一AI初创公司跻身独角兽: 专注于AI语音合成的ElevenLabs,刚刚完成8000万美元(约合人民币5.7亿元)B轮融资,估值超过10亿美元。 在语音克隆领域,ElevenLabs(11Labs)是公认的最强工具之一。 因霉霉说中...
-
Stable Diffusion 局部重绘(利用SD进行换脸)
首先明确一个概念:绘图是对整个图片进行重绘,但局部重绘是对你选中的位置重绘,这就是两个功能的不同点。 局部重绘详细步骤: 1、用画笔涂黑你想修改的地方,图片右边的蓝色点可以拖动 改变画笔大小,边缘适合用...
-
百分点科技宣布接入百度文心一言能力
2月16日, 百分点科技宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。后续,百分点科技将全面体验并接入文心一言的能力。 百分 点科技专注于数据科学理论和技术的创新实践,长期坚持基础技术和行业应用并重的自主研发...
-
三星S24手机搭载AI模型:AI大模型应用越来越广泛
手机厂商纷纷投入AI大模型的研发,标志着2018年进入快速发展阶段。预计到2027年,AI手机市场占比将达到45%,这一趋势源自智能手机行业对新技术的积极响应,尤其是生成式人工智能(GenAI)的迅猛发展。 目前,国内厂商已经推出了一系列与AI相关的硬件...
-
GPT与文心一言大模型的比较与展望
目录 前言 1 GPT和文心一言简介 2 GPT和文心一言的技术原理和基础架构 3 GPT和文心一言的模型规模和参数数量 4 GPT和文心一言的语言理解表现 5 展望GPT和文心一言未来的发展 5.1 技术改进 5.2 应用扩展 结语...
-
文心一言放开,百度搜索AI最强评测
今天凌晨,百度突然官宣,文心一言全面开放,人人都能上手用了! 现在,只需登陆「文心一言官网」即可体验。 真正重磅的是,一批全新重构的百度AI原生应用,包括百度搜索、「文心一言APP」、输入法、百度文库率先开放。 人人皆知,百度搜索是...
-
Stable Diffusion 黑白老照片上色修复
在这个时代,我们习惯于拥有高清、色彩丰富的照片,然而,那些古老的黑白色老照片由于年代的久远,往往会出现模糊、破损等现象。 那么今天要给大家介绍的是,用 Stable Diffusion 来修复老照片。 ...
-
AI作画的背后是怎么一步步实现的?一文详解AI作画算法原理+性能评测
前言 “AI作画依赖于多模态预训练,实际上各类作画AI模型早已存在,之所以近期作品质量提升很多,可能是因为以前预训练没有受到重视,还达不到媲美人类的程度,但随着数据量、训练量的增多,最终达到了现在呈现的效果。”远在AI作画还没有爆火之前,深度学习就已经...
-
LLM之RAG实战(十六)| 使用Llama-2、PgVector和LlamaIndex构建LLM Rag Pipeline
近年来,大型语言模型(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。其中RAG(Retrieval Augmented Generation,检索增强生成)是解决幻觉比较有效的方法。本文,我们将深入研究使用...
-
Chinese-llama-2部署踩坑记录
Chinese-llama-2部署踩坑记录 1. Chinese-LLaMA-Alpaca-2 A. 部署 a. inference_with_transformers_zh b. text generation webui_zh c. a...
-
Llama 2- Open Foundation and Fine-Tuned Chat Models<3>
3.4 RLHF 结果 3.4.1 基于模型的评估 评估LLMs是一个具有挑战性的开放研究问题。人类评估虽然是黄金标准,但可能会因各种 HCI 考虑因素而变得复杂(Clark 等人,2021;Gehrmann 等人,2023),并且并不总是可扩展的...
-
AI绘画Midjourney绘画提示词Prompt大全
一、Midjourney绘画工具 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美,可以说SparkAi是目前国内一款...
-
Stable Diffusion学习指南【图生图篇】
即使之前在Midjourney中有过图生图的使用经验,但大部分人对该功能的印象仅限于喂图,通过它可以让模型了解更多我们要传达的信息,从而达到准确出图的目的。但在Stable Diffusion中的图生图还要强大的多,除了控图还包含了手动涂鸦、局部重绘、图像...
-
抖音即创有哪些功能玩法 AI剪辑软件推荐
抖音即创是一款由抖音推出的智能创意生产与管理平台,旨在帮助用户快速制作高质量的视频、图文和直播内容。抖音即创的体验下载入口在哪呢,这里我们来看抖音即创的官方体验入口。 >>>点击前往 抖音即创 官方体验入口<<< 视频...
-
支付宝公布五福新玩法 2024年五福节AI玩法活动时间汇总
支付宝宣布2024年度集五福升级为五福节,新增新周期、新玩法、新朋友三大维度,首次引入四大AI玩法。 五福节分为三个阶段:五福年货节、集五福和过年天天乐。其中,五福年货节已于1月10日启动,集五福将于1月29日(腊月十九)正式开启,过年天天乐则在大年初一上...
-
UltrAvatar官网体验入口 AI生成逼真可动3D头像生成模型在线使用地址
UltrAvatar是一款逼真可动的3D头像生成模型,它采用先进的AI技术,可以生成高保真度、高质量的3D头像。UltrAvatar应用了Score Distillation Sampling (SDS loss和可微分渲染器以及文本条件来引导扩散模型生...
-
关于ChatGPT等AIGC技术对人类社会的影响
梗概 横空出世的ChatGPT作为新一代人工智能技术,开启了通用人工智能时代,标志着人工智能具有广泛的学习能力并在大多数领域达到或超过普通人类的水平,其社会影响将巨大而深远。面对这一新传播范式,对其原理架构与应用创新解析、风险认知、应对策略的相关研究刻不...
-
哄哄模拟器网页版入口 哄男女朋友AI模拟器在哪玩
“哄哄模拟器”的使用方法非常简单。首先,你需要选择一个吵架场景。场景包括约会迟到、太晚回家、吃掉对方想吃的东西等。选择场景后,你就可以开始进行沟通了。哄哄模拟器的体验下载入口在哪呢,这里我们来看哄哄模拟器的官方体验入口。 >>>点击前往...
-
[论文精读] 自条件图像生成 - 【恺明大神新作,AIGC 新基准】
论文导读: 论文背景: 2023年8月,AI大神何恺明在个人网站宣布,2024年将加入MIT担任教职,回归学术界。这篇论文是其官宣加盟MIT后首度与MIT师生合著的公开论文,论文一作本科毕业于清华姚班,二作为MIT电气工程与计算机科学系教授,今年的斯...
-
电商营销AI图片优化工具软件在线使用地址 Pic Copilot体验入口
Pic Copilot是一个利用图像生成模型为电商提供的AI驱动图片优化工具。它能够通过对大量图片点击量数据的训练,有效提高图片的点击转化率,从而优化电商的营销效果。其关键优势是提高图片的点击转化率,从而提升电商营销效果。它是阿里巴巴团队训练的数据结果,能...
-
认识 AIGC ,浅淡 AIGC 的那些事—— AIGC:用 AI 创造万物
文章目录 ?关于封面 ?关于活动 ?前言 ?什么是 AIGC ? ?AIGC:用 AI 创造万物 ?AIGC 的意义与发展 ?AIGC 的发展历程 ?人工智能生成内容的发展历程与概念 ?早期萌芽阶段(1950s-990s) ?沉淀积累阶段...
-
AI Art Generator Pro官网体验入口 AI创作艺术工具软件免费下载地址
AI Art Generator Pro是一款利用人工智能技术的图像创作工具,为艺术创作者提供了全新的方式。不仅可以模仿各种绘画风格,还能通过文本识别场景和对象生成高质量逼真的图像。独特之处在于,您可以轻松创建各种令人惊叹的视觉图像,无需专业的绘画技能。...
-
Beatoven.ai官网体验入口 AI免费音乐背景音乐使用地址入口
Beatoven.ai是一款基于 AI 的免费音乐生成工具,能够根据不同的情绪需求为视频、播客等内容生成定制化的背景音乐。它使用了先进的 AI 音乐创作技术,可以智能地根据内容的不同部分创作出多个配乐片段。 Beatoven.ai提供了 16 种不同情感...
-
OpenAI 竞争对手 Cohere 正在洽谈融资 10 亿美元
据英国《金融时报》报道,OpenAI 的竞争对手 Cohere 正在洽谈筹集最多10亿美元的资金。 随着人工智能竞赛的升温,这将是这家加拿大初创公司有史以来获得的最大一笔资金。Cohere 迄今为止已完成四次融资,最后一次融资是在2023年6月,这家初创公...
-
MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数
MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数...
-
一个开源的大型语言模型LLaMA论文简单解读,LLaMA: Open and Efficient Foundation Language Models
一个开源的大型语言模型LLaMA论文解读,LLaMA: Open and Efficient Foundation Language Models 返回论文和资料目录 1.导读 LLaMA 是 Meta AI 发布的包含 7...
-
AI创作系统ChatGPT网站源码,支持AI绘画,支持GPT语音对话+DALL-E3文生图+智能思维导图生成
一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美,可以说SparkAi是目前国内一款的ChatGPT对接Op...
-
copilot该服务在您所在的地区不可用,咋办?教你4个方法
微软Copilot是一款由GitHub和OpenAI合作开发的智能编程助手,它利用先进的人工智能技术,能够根据上下文和代码库中的信息,为程序员提供实时的代码建议和自动补全功能。这个程序可以帮助程序员提高编码效率,减少重复性的工作,同时也有助于降低错误率和提...
-
分析Stable Diffusion、AnimateDiff、animatediff-cli-prompt-travel 区别
1.animatediff-cli-prompt-travel 和animatediff区别 animatediff-cli-prompt-travel和animatediff在功能和使用方式上有一些不同。 首先,ani...
-
世界顶尖多模态大模型开源!又是零一万物,又是李开复
领跑中英文两大权威榜单,李开复零一万物交出多模态大模型答卷! 距离其首款开源大模型Yi-34B和Yi-6B的发布,仅间隔不到三个月的时间。 模型名为Yi Vision Language(Yi-VL),现已正式面向全球开源。 同属Yi系列,同样具有两个版本...
-
大模型 Dalle2 学习三部曲(一)Latent Diffusion Models学习
引言 Diffusion model大获成功,但是它的短板也很明显,需要大量的计算资源,并且推理速度比较慢。如何才能提升Diffusion model的计算效率。业界有各种各样的改进,无疑Latent Diffusion Models(潜在扩散模...
-
讯飞星火大模型V3.5将于1月30日发布 星火开源大模型等将亮相
讯飞星火 V3.5宣布将于2024年1月30日正式发布。 这次升级中,讯飞星火首次基于全国产化算力平台进行训练,实现了全民开放大模型。在逻辑推理、语言理解、文本生成、数学答题和多模态等核心能力上都有大幅提升。 此次发布还包括了星火语音大模型和星火开源大模...
-
Stable-diffusion安装时Can‘t load tokenizer for ‘openai/clip-vit-large-patch14‘2种解决方案
在安装Stable-diffusion WebuUI时,运行python launch.py出现Can‘t load tokenizer for ‘openai/clip-vit-large-patch14问题,这是因为安装过程中需要去huggingfac...
-
微信公众号集成文心一言API
要将微信公众号集成文心一言API,并使用Python语言和Flask技术实现,可以按照以下步骤进行操作: 安装必要的依赖项:首先,确保你的开发环境中已安装了Python和Flask库。你可以使用pip命令来安装它们,例如:pip install Fla...
-
M1本地部署Stable Diffusion
下载安装 参考博客: 在Mac上部署Stable Diffusion(超详细,AI 绘画入门保姆级教程) 安装需要的依赖库 brew install cmake protobuf rust python@3.10 git wget 可能中途会存在下...