-
详解各种LLM系列|LLaMA 1 模型架构、预训练、部署优化特点总结
作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/668698204 后台留言『交流』,加入 NewBee讨论组 LLaMA 是Meta在2...
-
stable diffusion微调总结
stable diffusion微调总结 stable diffusion 模型类别: SD SD2 SDXL SDXL LCM(潜在一致性模型) SDXL Distilled SDXL Turbo 安装accelerate 通过pip...
-
llama/llama2论文解读
llama 摘要 llama在约1.4T的token上,训练出参数量7B到65B的模型,其模型规模如下 在仅使用开源数据集的情况下,llama-13B在多数benchmarks上与GPT-3效果相当;llama-65B也与最好的模型(Chin...
-
【AI绘画】Stable Diffusion扩散模型 + Consistency一致性模型 小白必看!!!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 1 GAN到Stable Diffusion的改朝换代 2 从DDPM到Stable Diffusion发展史...
-
GLM团队开源超拟人大模型CharacterGLM 6B版
清华CoAI团队、聆心智能团队、GLM技术团队联手研发了CharacterGLM,一个专门为定制中文AI角色设计的模型,参数规模从6B到66B不等。相较于传统模型,CharacterGLM在表现上更为出色,使用门槛也更低。 为了让AI角色更加逼真,团队深入...
-
通义千问团队发布Qwen1.5 聊天模型性能大幅提升
在近期几个月的深入探索之后,通义千问团队终于迎来了其开源系列Qwen的下一个重要版本——Qwen1.5。 Qwen1.5的亮点之一是其丰富的模型系列,涵盖了从0.5B到72B的六种不同大小的基础和聊天模型。此外,团队还开源了包括Int4和Int8的GPTQ...
-
OccNeRF:完全无需激光雷达数据监督
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 近年来,3D 占据预测(3D Occupancy Prediction)任务因其独特的优势获得了学界及业界的广泛关注。3D 占据预测通过重建周围环境的 3D 结构为自...
-
PokéLLMon官网体验入口 AI智能代理战术游戏工具软件免费使用地址
PokéLLMon是首个在战术战斗游戏中实现人类水平性能的LLM体现代理。它融合了三种关键策略:1)基于上下文的强化学习,即时利用从战斗中提取的文本描述反馈,迭代地优化其生成策略;2)知识增强生成,利用外部知识对抗幻觉,使代理能够及时和正确地行动;3)具有...
-
【4】Midjourney常用技巧
【常用技巧】 本篇主要讲述MJ的常用技巧,围绕着一些常用指令的使用方法展开。 【版本切换】 在使用MJ时,最常用的技巧之一是版本切换。你可以在输入提示后添加"--v"加上相应的数字来实现版本切换。通常我默认使用MJ 4,偶尔会使用MJ 3或Niji。...
-
阿里Animate Anyone怎么用 AI生成动画视频软件手机下载方法
Animate Anyone是一款专为将静态图像转换为角色视频而设计的先进工具。它利用了扩散模型的强大功能,提供了一个定制的框架,可以为任意角色制作动画。这项技术特别适用于时尚视频合成和人类舞蹈生成等领域。 点击前往Animate Anyone体验入口...
-
Pika:AIGC新秀,视频生成产业或迎来GPT时刻
今天分享的AIGC系列深度研究报告:《Pika:AIGC新秀,视频生成产业或迎来GPT时刻》。 (报告出品方:中泰证券) 报告共计:11页 Pika:专注Text to Video生成场景,支持3D和动漫 ◼ Pika成立于2023年5月,是一...
-
【AIGC-图片生成视频系列-6】SSR-Encoder:用于主题驱动生成的通用编码器
目录 一. 贡献概述 二. 方法详解 a 训练阶段 b 推理生成阶段: 三. 综合结果 四. 注意力可视化 五. 选择性主题驱动图像生成 六. 人体图像生成 七. 可推广到视频生成模型 八. 论文 九. 个人思考 稳定扩散(S...
-
爆火的AI博主,是“摇钱树”还是“坑”?(附实测教程)
这段时间,平均一周就有一位虚拟博主火爆出圈。 自此前Instagram博主Emily靠堪称完美的颜值在Ins4周内涨粉超20万之后,最近,外网又有一位叫Lexi Love的AI博主火了。 Lexi Love的Ins账号数据 她的角色设定依旧是模特,背后的...
-
Stable Video Diffusion 1.1 Image-to-Video官网体验入口 AI生成视频模型免费使用地址
Stable Video Diffusion 1.1 Image-to-Video是一款先进的扩散模型,通过将静止图像作为条件帧,生成相应的视频。该潜在扩散模型经过精心训练,能够从图像生成高质量的短视频片段。在 1024x576 分辨率下,该模型训练生成...
-
如何使用MidJourney和ChatGPT制作动画短片?
Ammaar Reshi 当我制作这部使用生成式人工智能制作的蝙蝠侠动画短片时——我不知道它会在不到一周的时间内获得 700 万次观看。 想学!给我们讲解下是整体的制作流程吧!! opus Ammaar Res...
-
罕见!苹果开源图片编辑神器MGIE,要上iPhone?
拍张照片,输入文字指令,手机就开始自动修图? 这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。 把背景中的人移除 在桌子上添加披萨 最近一段时间,AI 在图片编辑这一应用上取得了不小的进展。一方面,在 LLM 的基础上,多模态大模型(MLL...
-
ChatGPT论文:大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较(一)
摘要 ChatGPT的成功引发了一场AI竞赛,研究人员致力于开发新的大型语言模型(LLMs),以匹敌或超越商业模型的语言理解和生成能力。近期,许多声称其性能接近GPT-3.5或GPT-4的模型通过各种指令调优方法出现了。作为文本到SQL解析的从业者,我...
-
极限挑战:使用 Go 打造百亿级文件系统的实践之旅
JuiceFS 企业版是一款为云环境设计的分布式文件系统,单命名空间内可稳定管理高达百亿级数量的文件。 构建这个大规模、高性能的文件系统面临众多复杂性挑战,其中最为关键的环节之一就是元数据引擎的设计。JuiceFS 企业版于 2017 年上线,经过几年的...
-
大模型真能解决一切吗?关于知识驱动自动驾驶的一些思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 上个星期受邀在外面做了一次关于「知识驱动自动驾驶」的讲座,刚好借这个机会把之前我和团队的一些学术上的思考整理凝练了一下。感觉里面一些内容还是挺值得拿出来分享&讨论的,所以开这么个帖子把其中一些关...
-
首个环视世界模型DrivingDiffusion: BEV数据和仿真新思路!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度...
-
AIGC内容分享(五十三):AIGC|深入浅出一个完整的视频生成系统「VGen」核心基础知识
目录 一、VGen整体架构 二、VGen核心基础内容 三、快速上手使用VGen进行视频生成 四、VGen与SVD的比较 一、VGen整体架构 「VGen」是一个基于扩散模型的视频生成系统,提供以视频生成扩散模型为中心的强大代码库,具有先进...
-
图感知对比学习提升多变量时间序列分类效果
今天给大家介绍一篇AAAI 2024中,由新加坡科技研究局(A*STAR)和新加坡南洋理工大学联合发表的时间序列分类工作,通过图感知对比学习改善多变量时间序列分类,取得了非常显著的效果提升。 图片 论文标题:Graph-Aware Contrasting...
-
什么是人工智能语音发生器及其工作原理?
近年来,人工智能语音生成器已经成为一项强大的技术,它正在改变人们与机器交互和接收数字内容的方式。创新系统通过使用人工智能模仿人类语音模式来工作,从而产生更真实、更自然的声音。在本文中,我们将探索人工智能生成发音的有趣领域,阐明其内部结构以及使其听起来如...
-
谷歌发布AI视频生成器Lumiere,在生成可爱动物视频方面表现出色
1月26日消息,据外媒报道,谷歌公布了一款名为Lumiere的人工智能视频生成器,并在相关的预印本论文中称其为“逼真视频生成的时空扩散模型”。Lumiere在制作可爱动物在荒谬场景中的视频方面做得很好,比如穿旱冰鞋、开车或弹钢琴。 根据谷歌的说法,Lu...
-
Poe推出新功能Image Remix 用户可修改和定制AI生成的图片
Poe最近推出了一个名为Image Remix的新功能,让用户可以随心所欲地修改和定制AI生成的图片。这项功能包括改变图片的风格、布局和颜色等,让用户能够根据自己的喜好创建更个性化的图片。 产品入口:https://top.aibase.com/tool...
-
Agent像人一样分工协作,还能“群聊”交换信息
智能体也要有“规范手册”! 一项名为MetaGPT的研究,通过对智能体角色进行明确分工,并要求多个智能体在协作中采用统一规范的“交流格式”等方法,让智能体性能大增。 目前,这项研究在GitHub上已狂揽33.6k星,并在深度学习顶会ICLR 2024上被...
-
AI「导师」进哈佛!7x24小时辅导CS课程,RAG或成AI教育最后一块拼图
去年,哈佛大学做了件大事。 他们在自己的CS50课程中引入了一整套AI工具,堪称学生个人的个性化「导师」。 一开始,这套工具服务的对象是70来个上暑校的学生。后来逐渐开放,数千名线上学生也得以拥有属于自己的学习导师。 到了秋季,AI工具又面向了几百位本校...
-
人工智能大时代——AIGC综述
生成式AI分类 模型按照输入输出的数据类型分类,目前主要包括9类。 有趣的是,在这些已发布大模型的背后,只有六个组织(OpenAI, Google, DeepMind, Meta, runway, Nvidia)参与部署了这些最先进的模型。...
-
最新研究发现,85%的开发人员使用GitHub Copilot和Copilot Chat时对代码质量更有信心
近期,GitHub发布了关于GitHub Copilot Chat的最新研究报告。通过利用自然语言的力量,该研究中的开发人员使用GitHub Copilot Chat实时获取指导、提示、故障排除、补救措施以及针对其特定编码挑战的解决方案,而所有这些都是在不...
-
LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比
12.10更新:Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理:数据频率和质量,使用聚类和去重方法,基于LSH和dense embedding方...
-
AIGC智能编程:编程革新还是就业陷阱?
AIGC智能编程:程序员的失业陷阱? 引言 随着人工智能的迅猛发展,智能编程技术也越来越受到关注。AIGC智能编程是一种利用人工智能技术自动生成代码的方法,它能够极大地提高编程效率和质量。然而,这种技术的兴起也引发了人们对程序员就业前景的忧虑。本文...
-
AIGC内容分享(三十六):“AIGC的触摸”如何赋予UI设计新生命
目录 一、UI设计的基本原则与AIGC的融合 1. 一致性与风格化的AIGC 2. 反馈与交互式AIGC 3. 简化操作与智能化AIGC 4. 可用性与适应性AIGC 5. 吸引力与创意AIGC 二、利用AIGC生成界面——操作指南 1.使...
-
史上最全知识图谱建模实践(下):多元关系架构
在“知识图谱之本体结构与语义解耦——基于OpenSPG的建模实践(上)”一文中,我们从实体关系设计和概念语义建模2种场景,讲解了基于SPG的知识建模的方法和案例。 本文中,我们将继续讲解多元关系架构场景中的知识建模实践。如果你的图谱,涉及对带有时空信息的...
-
被鹅厂最新开源AI绘画工具PhotoMaker圈粉了,多风格头像生成器就靠它了!
要说本周AIGC开源爆火项目,腾讯的PhotoMaker 可以入选其一。而 PhotoMaker 是腾讯Arc于4天前开源上线到GitHub的,更有一众互联网科技领域大V体验推荐,当前Star已经有4.7k了! 相信小编这篇文章发布时star预测可能达到...
-
AI图像生成器Midjourney意外创建不当内容,违反其自身准则
近日,The Debrief报道了一项有关AI图像平台Midjourney的研究,发现该平台意外生成了不适内容,违反了其自身的使用准则。Midjourney明确规定用户不得故意创建明确或性内容,以保持“PG-13”等级,并通过屏蔽特定关键词来实施严格的过滤...
-
Ai作画区域控制的几种方法
背景 距上次发文章,又过去好久。这期分享给大家带来的是Ai作画的图结构控制几种方法。现在大家用AI作画大部分情况是直接使用AI单图生成能力,其实并不太会取考虑构图,也不太会考虑到大图的图结构这件事。其实构图这件事是一件很综合复杂的事情,很难去定义什么样的...
-
【AIGC-图片生成视频系列-5】I2V-Adapter:一种用于视频扩散模型的通用图像生成视频适配器
目录 一. 项目与贡献概述 二. 方法详解 a. 整体框架图 b. 帧相似性先验 三. 一般化图像生成动画结果 四. 基于个性化 T2I 模型的动画结果 五. 结合ControlNet动画结果 六. 项目论文和代码 七. 个人思考与总结...
-
Amazon CodeWhisperer 审查:最新的 AI 代码伴侣
最近,亚马逊云科技宣布了一项机器学习支持的服务,该服务通过根据开发人员在自然语言中的评论和他们在集成开发环境中的代码生成代码建议来帮助提高开发人员的工作效率。这项名为 Amazon CodeWhisprer 的服务仍处于预览阶段,可以免费使用。这项服务类似...
-
十分钟读完「降低 LLaMA 模型微调内存占用的QLoRA」论文
QLoRA 提出内存高效的微调方法!降低 LLaMA 模型微调内存占用,仅需数小时追赶 ChatGPT 引言:大模型微调的新时代 随着人工智能技术的飞速发展,大型语言模型(Large Language Models,LLMs)已成为自然语言处理领域的重...
-
GPT-4无法造出生物武器!OpenAI最新实验证明:大模型杀伤力几乎为0
GPT-4会加速生物武器的发展吗?在担心AI统治世界之前,人类是否会因为打开了潘多拉魔盒而面临新的威胁? 毕竟,大模型输出各种不良信息的案例不在少数。 今天,处在风口,也是浪尖的OpenAI再次负责任地刷了一波热度。 图片 我们正在建立一个能够协助制造生...
-
AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 谷歌最新文生图小型...
-
给ChatGPT小费真的好使!10块或10万效果拔群,但给1毛不升反降
还有谁不知道“假装”给ChatGPT小费可以让它服务更卖力? 但你知道给多少最合适吗? 笑不活了,还真有人专门研究了一番。 方法简单粗暴,从0.1美元到100美元,不同额度用同样的prompt去尝试,每个额度试5次。 你别说,结果还真有讲究: 首先,给...
-
最强开源多模态生成模型MM-Interleaved:首创特征同步器
想象一下,AI 不仅会聊天,还长了「眼睛」,能看懂图片,甚至还会通过画画来表达自己!这意味着,你可以和它们谈天说地,分享图片或视频,它们也同样能用图文并茂的方式回应你。 最近,上海人工智能实验室联合香港中文大学多媒体实验室(MMLab)、清华大学、商汤科...
-
人类和AI的决策协作:决策问题的表述、解释和评价
在人工智能、数据可视化等领域,如何利用信息显示来辅助人类做出更好的决策,是一个重要的研究目标。什么是一个决策问题,以及如何设计一个能够有效评估人类决策的实验,没有一个明确的共识。在这篇文章中,我将为您解读一篇最新的论文,它提出了一个基于统计决策理论和信息...
-
在医疗保健中平衡AI的好处与安全和隐私风险
基于风险的方法优先考虑风险最高的领域,并建议提供商在低风险领域投入较少的精力。内部审计和合规计划与企业面临的最关键风险之间的一致性越好,企业的内部审计和合规投资产生的风险回报就越大。 五大风险领域 医疗保健组织面临着五个最高的风险领域,内部审计和合规领...
-
阿里Animate Anyone体验入口 AI生成动画视频怎么使用指南教程方法
Animate Anyone是一款专为角色动画而设计的先进扩散模型。通过驱动信号从静态图像生成角色视频,Animate Anyone引入了一系列创新性的技术,包括ReferenceNet、高效的姿势指导器以及有效的时间建模方法。这些设计保证了生成的视频在外...
-
近200+自动驾驶数据集全面调研!一览如何数据闭环全流程
写在前面&个人理解 自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展,并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集,但要么集中在有限数量的数据集上,要么缺乏对数据集特征的详细调查...
-
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
只会「看书」的大语言模型,有现实世界的视觉感知力吗?通过对字符串之间的关系进行建模,关于视觉世界,语言模型到底能学会什么? 最近,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的研究人员对语言模型的视觉能力进行了系统的评估,从简单形状、物体...
-
一文了解国外AIGC头部产品
AIGC是指通过人工智能技术生成的内容,包括文字、图片、音频和视频等。AIGC技术可以基于大量的数据和算法,自动地生成各种类型的内容,可以用于新闻报道、广告宣传、文学创作、游戏设计等各个领域。AIGC技术的优点在于可以大大提高内容生产的效率和质量,节省了人...
-
链世界:一种简单而有效的人类行为Agent模型强化学习框架
强化学习是一种机器学习的方法,它通过让智能体(Agent)与环境交互,从而学习如何选择最优的行动来最大化累积的奖励。强化学习在许多领域都有广泛的应用,例如游戏、机器人、自动驾驶等。强化学习也可以用于干预人类的行为,帮助人类实现他们的长期目标,例如戒烟、减...