-
人工智能改变牙科服务的六大趋势
难道已经有机器人牙医了吗?还没有……。但是,牙科诊所已经加快了将新兴技术融入常规诊疗的步伐。人工智能也不例外。事实上,人工智能正在显著改变牙科行业,牙科行业提供的一系列创新技术正在改善患者护理和提高诊断准确性及运营效率。我们已经看到了以下的六大趋势。...
-
如何训练一个简单的stable diffusion模型(附详细注释)
注:代码来自https://github.com/darcula1993/diffusion-models-class-CN/blob/main/unit1/01_introduction_to_diffusers_CN.ipynb 本文是本人学习后的...
-
QTNet:最新时序融合新方案!点云、图像、多模态检测器全适用(NeurIPS 2023)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 & 个人理解 时序融合能够有效提升自动驾驶3D目标检测的感知能力,然而目前的时序融合方法由于成本开销等问题难以在实际自动驾驶场景中应用。NeurIPS 2023的最新研究文章 《Qu...
-
What the DAAM: Interpreting Stable Diffusion Using Cross Attention
What the DAAM: Interpreting Stable Diffusion Using Cross Attention (Paper reading Raphael Tang, Comcast Applied AI, ACL2023 b...
-
扩散模型训练太难?来看看Meta AI最新提出的KNN-Diffusion
原文链接:https://www.techbeat.net/article-info?id=4323 作者:seven_ 最近AIGC社区中有趣的工作可谓是层出不穷,这都得益于扩散模型(Diffusion Models)的成功,扩散模型作为生成式AI...
-
谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney!
提问:下面这张图,是AI生图还是照片? 如果不是这么问,绝大多数人大概都不会想到,这居然不是一张照片。 是的,只要在谷歌最新AI生图神器Imagen 2中输入这样的提示词—— A shot of a 32-year-old female, up an...
-
24 LLM错误代码补全:机器学习顶会NeurIPS‘23 智能体评估:自行构建数据集Buggy-HumanEval、Buggy-FixEval+错误代码补全+修复模型【网安AIGC专题11.22】
Large Language Models of Code Fail at Completing Code with Potential Bugs 写在最前面 论文名片 对于命名实体识别、关系抽取任务的启发 课堂讨论 实验 自己构建的数据集...
-
LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界
斯坦福华人退学博士开发的Pika,让AI技术和艺术迸发出了绚丽的火花。 最近,又有斯坦福的华人研究人员提出的新的框架——WonderJourney, 可以用一句话或者一张图,自动生成一系列3D场景的连续画面,效果炫酷! 图片 用一张爱丽丝奇境漫游的图片,...
-
首个「创造式任务」基准来了!北大清华联手发布Creative Agents:专为想象力而生!
近年来,许多研究通过训练服从自然语言指令的智能体,让智能体具有了解决各种开放式任务的能力。 例如,SayCan[1]利用语言模型实现了根据语言描述解决各种室内机器人任务的智能体,Steve-1[2]训练端到端的策略实现了能够在《我的世界》(Minecra...
-
大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE
大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。 近日,滑铁...
-
暴打GPT-3.5,谷歌Gemini大杀器官宣免费用!最强代码生成工具上线支持20+语言
谷歌年底开发者福利大放送来了! 谷歌Gemini发布一周之后,面向开发者的API也终于上线了。 目前,不管是Gemini Pro,还是Gemini Pro Vision,都可以免费体验。 虽然每分钟最多支持60次请求,但基本上可以满足大多数应用程序开发...
-
一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”
斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作! 仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景: 只需输入一段古诗词,诗中场景立刻映入眼帘: 而且还是来回式的,可以再倒回去的那种: 同一起点可以进入不同场景: 真实场景也可以,其中的...
-
OpenAI 与出版巨头施普林格达成史无前例的协议,为 ChatGPT 提供新闻数据
12 月 14 日消息,新闻出版巨头施普林格出版集团(Axel Springer)与 ChatGPT 开发机构 OpenAI 宣布达成一项史无前例的协议,允许 ChatGPT 对来自 Politico 和 Business Insider 等媒体的新闻...
-
OpenAI 和 Axel Springer 达成史无前例的协议,允许 ChatGPT 摘要其付费新闻内容
OpenAI 和全球新闻出版商 Axel Springer 周三宣布,双方达成了一项史无前例的协议,允许 ChatGPT 总结来自 Politico 和 Business Insider 等媒体的新闻报道。 这家德国媒体集团将因向美国人工智能公司提供内容...
-
Chinese-LLaMA-AIpaca 指令精调
文章目录 一、继续训练 Chinese-AIpaca 模型的 LoRA权重 二、基于中文Chinese-LLaMA训练全新的指令精调LoRA权重 1、合并 2、基于中文 Chinese-LLa...
-
邢波团队提出全开源倡议LLM360 让大模型实现真正的透明
开源模型在人工智能领域展现强大活力,但闭源策略限制了LLM(大型语言模型)的发展。邢波团队提出的LLM360全面开源倡议旨在解决这一问题。该框架明确了包括训练数据、代码、模型检查点和性能指标在内的各方面细节,为当前和未来的开源模型树立了透明度的样本。 论...
-
stable diffusion打造自己专属的LORA模型
通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自己的训练好的Lora模型放...
-
微软小模型击败大模型:27亿参数,手机就能跑
上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。 今天,微软公布了 Phi-2 模型的更多细节以及全新的提示技术 promptbase。这个仅 27 亿参...
-
Hugging News #0814: Llama 2 学习资源大汇总
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣...
-
LLaMA-Factory使用V100微调ChatGLM2报错 RuntimeError: “addmm_impl_cpu_“ not implemented for ‘Half‘
微调命令 CUDA_VISIBLE_DEVICES=0 python /aaa/LLaMA-Factory/src/train_bash.py \ --stage sft \ --model_name_or_path /aaa/LLaMA...
-
面向 Stable Diffusion 的自动 Prompt 工程算法 BeautifulPrompt
近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型,可以从简单的图片描述中生成高质量的提示词,从而使文生图模型能够生成更美观的图像。BeautifulP...
-
消息称 Meta 无视自家律师警告,使用盗版书籍训练 AI 模型
12 月 13 日消息,据路透社报道,根据一起版权侵权诉讼的新文件显示,Meta Platforms 在明知使用数千本盗版书籍训练其 AI 模型存在法律风险的情况下,仍然一意孤行。 据IT之家了解,该诉讼由喜剧演员 Sarah Silverman、普...
-
AI视野:Midjourney正式上线Alpha网页版;OpenAI恢复会员注册;腾讯发布视频生成模型AnimateZero;微软发布小语言模型AI Phi-2
???AI应用 Midjourney正式上线Alpha网页版!支持已生成图片设置参数回填 Midjourney Alpha全新升级,生成用户界面更便捷,成功生成1万张图片即可获得权限,可视化图像参数支持点击回填到提示词输入框,提升生成体验。 截图自归藏...
-
一张照片、一段声音秒生超逼真视频!南大等提出全新框架,口型动作精准还原
一段音频+一张照片,瞬间照片里的人就能开始讲话了。 生成的讲话动画不但口型和音频能够无缝对齐,面部表情和头部姿势都非常自然而且有表现力。 而且支持的图像风格也非常的多样,除了一般的照片,卡通图片,证件照等生成的效果都非常自然。 再加上多语言的支持,瞬间照...
-
美国联邦机构提出1200个AI用例,但只有少数得以实施
美国联邦机构看到在其日常工作中使用人工智能工具的许多可能性,但实际上只有其中一小部分被付诸实践。周二发布的一份报告显示,审计署发现20个非国防机构在政府中鉴定了超过1,200种用例,但它们只实施了其中约16%的人工智能用例。 例如,人事管理局正在利用人工智...
-
全方位、无死角的开源,邢波团队LLM360让大模型实现真正的透明
开源模型正展现着它们蓬勃的生命力,不仅数量激增,性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹:「开源人工智能模型正走在超越专有模型的路上。」 专有模型在技术性能和创新能力上展现了非凡的力量,但是它们不开源的性质成为 LLM 发...
-
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
大模型现在真的是越来越卷了! 11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的流量。 谷歌被逼急了,赶在年底之前仓促发布了超大模型Gemini,卷起了多模态,甚至不惜「视频造假」。 就在今天,微软正式发布了曾在11...
-
高效微调技术QLoRA实战,基于LLaMA-65B微调仅需48G显存,真香
目录 环境搭建 数据集准备 模型权重格式转换 模型微调 模型权重合并...
-
通义千问72B模型荣登大模型评测平台OpenCompass榜首
中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。 OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的...
-
如何在Python中使用ChatGPT API处理实时数据
译者 | 李睿 审校 | 重楼 OpenAI公司推出的GPT如今已经成为全球最重要的人工智能工具,并精通基于其训练数据处理查询。但是,它不能回答未知话题的问题,例如: 2021年9月之后的近期事件 非公开文件 来自过去谈话的信息 当用户处...
-
首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要,可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展,在线向量化高精地图构建逐渐兴起,代表性...
-
由谷歌著名人工智能论文两位共同作者创立的 Essential AI 获得 5700 万美元融资
据彭博新闻报道,由两位谷歌资深人士创立的人工智能初创公司 Essential AI 已从隐秘状态中浮现,获得了 5650 万美元的新融资。 Essential AI 开发了一项名为「企业大脑」的技术,该技术可以利用 AI 执行企业职能,如数据分析,并自动...
-
RayDF:实时渲染!基于射线的三维重建新方法
本文经自动驾驶之心公众号授权转载,转载请联系出处。 图片 论文链接:https://arxiv.org/pdf/2310.19629 代码链接:https://github.com/vLAR-group/RayDF 主页:https://vlar-gro...
-
LLaMA及其子孙模型概述
文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽 骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性,对...
-
【Video-LLaMA】增强LLM对视频内容的理解
Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understanding》 Authors: Hang Zhang, Xin Li, Lid...
-
基于LoRA微调部署Stable Diffusion【免费试用阿里云】
文章目录 Stable Diffusion介绍 环境及资源准备过程 交互式建模(PAI-DSW)的试用 在创建的工作空间中创建实例 Stable Diffusion的Web-UI部署 下载stable-diffusion-webui开源库...
-
LLMs之Chinese-LLaMA-Alpaca-2:源码解读(run_clm_pt_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的chec
LLMs之Chinese-LLaMA-Alpaca-2:源码解读(run_clm_pt_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数据...
-
训练自己的Llama 2!大模型微调技术介绍
训练自己的Llama 2!大模型微调技术介绍 趋动云 趋动云是面向 AI 算法工程师的开发平台,为工程师提供模型开发、模型训练、数据和代码管理等功能。 近期有不少粉丝问算力君,趋动云是否支持大模型的训练?当然支持! 最近大火的Llama...
-
华科大发布AI大模型猴子:部分超越GPT-4
快科技12月12日消息,华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型Monkey”。 该模型擅长图像描述和视觉问答,能够实现对世界的观察”,对图片进行深入问答交流和精确描述。 官方介绍称,在18个数据集上的实验中,华科大Monkey模型表...
-
马斯克摊上事了!Grok AI被爆疑似抄袭ChatGPT??
大家好,我是二狗。 马斯克今天摊上事了! X(推特)一名网友爆料,马斯克旗下xAI公司研发的Grok AI疑似“抄袭”ChatGPT。 Grok 在回答网友的一个问题时,做出了令人震惊的“承认”: “恐怕我无法满足该请求,因为它违反了OpenAI的用例政...
-
Bard AI:训练过程中使用了多少数据?
近年来,人工智能取得了长足的进步,并在科技界掀起了波澜。 随着谷歌最近推出新的人工智能聊天机器人 Bard,人们对这项技术的工作原理以及训练它的内容感到好奇。 人工智能技术的关键组成部分之一是训练过程中使用的数据量,这有助于它更好地理解语言、...
-
信通院启动《大模型数据开发管理能力评价方法总体要求》编制
据中国信通院消息,为破解大模型训练数据发展瓶颈,深入推进人工智能数据高质量发展,由中国信息通信研究院牵头发起《大模型数据开发管理能力评价方法总体要求》标准编制工作,联合发起单位包括中国联通集团、华为技术有限公司、科大讯飞、商汤科技、蚂蚁科技集团等18家单位...
-
LLaMA(大规模机器学习和分析)
LLaMA(大规模机器学习和分析 是一个先进的软件平台,是Meta 推出 AI 语言模型 LLaMA,一个有着 上百亿数量级参数的大语言模型用于大规模部署和管理机器学习模型。借助LLaMA,组织可以高效地在大型数据集上训练和部署模型,缩短投放市场的...
-
ChatGPT的训练数据可以通过“偏离攻击”进行泄露
ChatGPT等大语言模型(LLM)使用来自图书、网站及其他来源的海量文本数据进行训练,通常情况下,训练它们所用的数据是一个秘密。然而,最近的一项研究揭示:它们有时可以记住并反刍训练它们所用的特定数据片段。这个现象名为“记忆”。 随后,来自谷歌Deep...
-
智谱AI发布中文 LLM 对齐评测基准AlignBench
智谱AI发布了专为中文大语言模型(LLM)而生的对齐评测基准AlignBench,这是目前第一个针对中文大模型的评测基准,能够在多维度上细致评测模型和人类意图的对齐水平。 AlignBench 的数据集来自于真实的使用场景,经过初步构造、敏感性筛查、参考答...
-
阿里研究部门推出了专为东南亚量身定制的AI大模型SeaLLM
阿里巴巴集团旗下研究机构达摩院推出了专为东南亚语言量身定制的人工智能(AI)大语言模型(LLM ,凸显了该公司在更广泛地区发展市场的雄心。 阿里巴巴研究部门表示,东南亚LLM(SeaLLM)在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅...
-
阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!
继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了—— 这一次,只需一张脸部照片、一句话描述,就能让你在任何地方跳舞! 例如下面这段《擦玻璃》的舞蹈视频: 图片 你所需要做的就是“投喂”一张人像,以及一段prompt: 一个女孩,微笑着,...
-
2024年云和人工智能未来趋势
当我们站在新技术时代的风口浪尖时,云计算和人工智能(AI 的融合必将深刻重塑行业。 2023年:技术进步的一年 在未来的一年里,我们预计在技术创新的推动下,各行业将取得重大进展。在超低延迟的推动下,边缘计算有望卷土重来,彻底改变实时数据处理。这种复苏将...
-
马斯克的AI机器人说自己不能违反OpenAI使用政策,业界分析:可能是这样
12月12日消息,特斯拉和SpaceX首席执行官埃隆·马斯克(Elon Musk)旗下人工智能创企xAI最近发布了其聊天机器人Grok,但好像出了点问题。 上周五,安全测试员贾克斯·温特伯恩(Jax Winterbourne)在社交媒体平台X上发布了一...
-
神经网络是如何工作的? | 京东云技术团队
作为一名程序员,我们习惯于去了解所使用工具、中间件的底层原理,本文则旨在帮助大家了解AI模型的底层机制,让大家在学习或应用各种大模型时更加得心应手,更加适合没有AI基础的小伙伴们。 一、GPT与神经网络的关系 GPT想必大家已经耳熟能详,当我们与它...