-
Hugging News #0814: Llama 2 学习资源大汇总
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣...
-
LLaMA-Factory使用V100微调ChatGLM2报错 RuntimeError: “addmm_impl_cpu_“ not implemented for ‘Half‘
微调命令 CUDA_VISIBLE_DEVICES=0 python /aaa/LLaMA-Factory/src/train_bash.py \ --stage sft \ --model_name_or_path /aaa/LLaMA...
-
面向 Stable Diffusion 的自动 Prompt 工程算法 BeautifulPrompt
近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型,可以从简单的图片描述中生成高质量的提示词,从而使文生图模型能够生成更美观的图像。BeautifulP...
-
消息称 Meta 无视自家律师警告,使用盗版书籍训练 AI 模型
12 月 13 日消息,据路透社报道,根据一起版权侵权诉讼的新文件显示,Meta Platforms 在明知使用数千本盗版书籍训练其 AI 模型存在法律风险的情况下,仍然一意孤行。 据IT之家了解,该诉讼由喜剧演员 Sarah Silverman、普...
-
AI视野:Midjourney正式上线Alpha网页版;OpenAI恢复会员注册;腾讯发布视频生成模型AnimateZero;微软发布小语言模型AI Phi-2
???AI应用 Midjourney正式上线Alpha网页版!支持已生成图片设置参数回填 Midjourney Alpha全新升级,生成用户界面更便捷,成功生成1万张图片即可获得权限,可视化图像参数支持点击回填到提示词输入框,提升生成体验。 截图自归藏...
-
一张照片、一段声音秒生超逼真视频!南大等提出全新框架,口型动作精准还原
一段音频+一张照片,瞬间照片里的人就能开始讲话了。 生成的讲话动画不但口型和音频能够无缝对齐,面部表情和头部姿势都非常自然而且有表现力。 而且支持的图像风格也非常的多样,除了一般的照片,卡通图片,证件照等生成的效果都非常自然。 再加上多语言的支持,瞬间照...
-
美国联邦机构提出1200个AI用例,但只有少数得以实施
美国联邦机构看到在其日常工作中使用人工智能工具的许多可能性,但实际上只有其中一小部分被付诸实践。周二发布的一份报告显示,审计署发现20个非国防机构在政府中鉴定了超过1,200种用例,但它们只实施了其中约16%的人工智能用例。 例如,人事管理局正在利用人工智...
-
全方位、无死角的开源,邢波团队LLM360让大模型实现真正的透明
开源模型正展现着它们蓬勃的生命力,不仅数量激增,性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹:「开源人工智能模型正走在超越专有模型的路上。」 专有模型在技术性能和创新能力上展现了非凡的力量,但是它们不开源的性质成为 LLM 发...
-
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
大模型现在真的是越来越卷了! 11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的流量。 谷歌被逼急了,赶在年底之前仓促发布了超大模型Gemini,卷起了多模态,甚至不惜「视频造假」。 就在今天,微软正式发布了曾在11...
-
高效微调技术QLoRA实战,基于LLaMA-65B微调仅需48G显存,真香
目录 环境搭建 数据集准备 模型权重格式转换 模型微调 模型权重合并...
-
通义千问72B模型荣登大模型评测平台OpenCompass榜首
中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。 OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的...
-
如何在Python中使用ChatGPT API处理实时数据
译者 | 李睿 审校 | 重楼 OpenAI公司推出的GPT如今已经成为全球最重要的人工智能工具,并精通基于其训练数据处理查询。但是,它不能回答未知话题的问题,例如: 2021年9月之后的近期事件 非公开文件 来自过去谈话的信息 当用户处...
-
首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要,可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展,在线向量化高精地图构建逐渐兴起,代表性...
-
由谷歌著名人工智能论文两位共同作者创立的 Essential AI 获得 5700 万美元融资
据彭博新闻报道,由两位谷歌资深人士创立的人工智能初创公司 Essential AI 已从隐秘状态中浮现,获得了 5650 万美元的新融资。 Essential AI 开发了一项名为「企业大脑」的技术,该技术可以利用 AI 执行企业职能,如数据分析,并自动...
-
RayDF:实时渲染!基于射线的三维重建新方法
本文经自动驾驶之心公众号授权转载,转载请联系出处。 图片 论文链接:https://arxiv.org/pdf/2310.19629 代码链接:https://github.com/vLAR-group/RayDF 主页:https://vlar-gro...
-
LLaMA及其子孙模型概述
文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽 骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性,对...
-
【Video-LLaMA】增强LLM对视频内容的理解
Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understanding》 Authors: Hang Zhang, Xin Li, Lid...
-
基于LoRA微调部署Stable Diffusion【免费试用阿里云】
文章目录 Stable Diffusion介绍 环境及资源准备过程 交互式建模(PAI-DSW)的试用 在创建的工作空间中创建实例 Stable Diffusion的Web-UI部署 下载stable-diffusion-webui开源库...
-
LLMs之Chinese-LLaMA-Alpaca-2:源码解读(run_clm_pt_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的chec
LLMs之Chinese-LLaMA-Alpaca-2:源码解读(run_clm_pt_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数据...
-
训练自己的Llama 2!大模型微调技术介绍
训练自己的Llama 2!大模型微调技术介绍 趋动云 趋动云是面向 AI 算法工程师的开发平台,为工程师提供模型开发、模型训练、数据和代码管理等功能。 近期有不少粉丝问算力君,趋动云是否支持大模型的训练?当然支持! 最近大火的Llama...
-
华科大发布AI大模型猴子:部分超越GPT-4
快科技12月12日消息,华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型Monkey”。 该模型擅长图像描述和视觉问答,能够实现对世界的观察”,对图片进行深入问答交流和精确描述。 官方介绍称,在18个数据集上的实验中,华科大Monkey模型表...
-
马斯克摊上事了!Grok AI被爆疑似抄袭ChatGPT??
大家好,我是二狗。 马斯克今天摊上事了! X(推特)一名网友爆料,马斯克旗下xAI公司研发的Grok AI疑似“抄袭”ChatGPT。 Grok 在回答网友的一个问题时,做出了令人震惊的“承认”: “恐怕我无法满足该请求,因为它违反了OpenAI的用例政...
-
Bard AI:训练过程中使用了多少数据?
近年来,人工智能取得了长足的进步,并在科技界掀起了波澜。 随着谷歌最近推出新的人工智能聊天机器人 Bard,人们对这项技术的工作原理以及训练它的内容感到好奇。 人工智能技术的关键组成部分之一是训练过程中使用的数据量,这有助于它更好地理解语言、...
-
信通院启动《大模型数据开发管理能力评价方法总体要求》编制
据中国信通院消息,为破解大模型训练数据发展瓶颈,深入推进人工智能数据高质量发展,由中国信息通信研究院牵头发起《大模型数据开发管理能力评价方法总体要求》标准编制工作,联合发起单位包括中国联通集团、华为技术有限公司、科大讯飞、商汤科技、蚂蚁科技集团等18家单位...
-
LLaMA(大规模机器学习和分析)
LLaMA(大规模机器学习和分析 是一个先进的软件平台,是Meta 推出 AI 语言模型 LLaMA,一个有着 上百亿数量级参数的大语言模型用于大规模部署和管理机器学习模型。借助LLaMA,组织可以高效地在大型数据集上训练和部署模型,缩短投放市场的...
-
ChatGPT的训练数据可以通过“偏离攻击”进行泄露
ChatGPT等大语言模型(LLM)使用来自图书、网站及其他来源的海量文本数据进行训练,通常情况下,训练它们所用的数据是一个秘密。然而,最近的一项研究揭示:它们有时可以记住并反刍训练它们所用的特定数据片段。这个现象名为“记忆”。 随后,来自谷歌Deep...
-
智谱AI发布中文 LLM 对齐评测基准AlignBench
智谱AI发布了专为中文大语言模型(LLM)而生的对齐评测基准AlignBench,这是目前第一个针对中文大模型的评测基准,能够在多维度上细致评测模型和人类意图的对齐水平。 AlignBench 的数据集来自于真实的使用场景,经过初步构造、敏感性筛查、参考答...
-
阿里研究部门推出了专为东南亚量身定制的AI大模型SeaLLM
阿里巴巴集团旗下研究机构达摩院推出了专为东南亚语言量身定制的人工智能(AI)大语言模型(LLM ,凸显了该公司在更广泛地区发展市场的雄心。 阿里巴巴研究部门表示,东南亚LLM(SeaLLM)在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅...
-
阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!
继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了—— 这一次,只需一张脸部照片、一句话描述,就能让你在任何地方跳舞! 例如下面这段《擦玻璃》的舞蹈视频: 图片 你所需要做的就是“投喂”一张人像,以及一段prompt: 一个女孩,微笑着,...
-
2024年云和人工智能未来趋势
当我们站在新技术时代的风口浪尖时,云计算和人工智能(AI 的融合必将深刻重塑行业。 2023年:技术进步的一年 在未来的一年里,我们预计在技术创新的推动下,各行业将取得重大进展。在超低延迟的推动下,边缘计算有望卷土重来,彻底改变实时数据处理。这种复苏将...
-
马斯克的AI机器人说自己不能违反OpenAI使用政策,业界分析:可能是这样
12月12日消息,特斯拉和SpaceX首席执行官埃隆·马斯克(Elon Musk)旗下人工智能创企xAI最近发布了其聊天机器人Grok,但好像出了点问题。 上周五,安全测试员贾克斯·温特伯恩(Jax Winterbourne)在社交媒体平台X上发布了一...
-
神经网络是如何工作的? | 京东云技术团队
作为一名程序员,我们习惯于去了解所使用工具、中间件的底层原理,本文则旨在帮助大家了解AI模型的底层机制,让大家在学习或应用各种大模型时更加得心应手,更加适合没有AI基础的小伙伴们。 一、GPT与神经网络的关系 GPT想必大家已经耳熟能详,当我们与它...
-
LLM之Prompt(二):清华提出Prompt 对齐优化技术BPO
论文题目:《Black-Box Prompt Optimization: Aligning Large Language Models without Model Training》 论文链接:https://arxiv.org/abs/2311.041...
-
现代仓储正在为第五次工业革命让路
作为一个整体,世界正在看到技术的进步和越来越多的接受。仓储也不例外。随着现代仓储实践融入创新技术,该行业正在向第五次工业革命过渡。自动化、新兴趋势和变革性技术的进步正在导致人类与技术或机器之间的协作最大化。 例如,人工智能(AI 和机器人技术等技术的集...
-
TTS算法笔记:MusicLM- Generating Music From Text(AI生成音乐)
1. 介绍 摘要: 介绍了一个以文本作为条件,生成高保真、长时间片的音乐音频。比如文本为“由扭曲的吉他重复段伴奏的平静的小提琴旋律”,MusicLM可以可以根据文本条件,生成24kHz采样率,分钟级别的连续音乐音频。 从摘要中可以得知,这篇文章解决的根...
-
要和文心一言来一把你画我猜吗?
想和文心一言来一把你画我猜吗? ChatGPT的爆火,让AI对话模型再次走入大众视野。大家在感叹ChatGPT的智能程度时,总会忍不住想:如果我们也有自己的AI对话模型就好了。在社会的压力下,国内的厂商和研究机构也纷纷做出尝试。最早是复旦的MOSS,随后...
-
Stability AI推出Stable Diffusion XL 1.0,文本到图像模型
Stability AI宣布推出Stable Diffusion XL 1.0,这是一个文本到图像的模型,该公司将其描述为迄今为止“最先进的”版本。 Stability AI表示,SDXL 1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强...
-
BlueLM蓝心大模型好不好用 手机AI大模型推荐
BlueLM 蓝心大模型是 vivo 研发的一种通用人工智能语言模型。它是基于 Transformer 架构的,并使用了大量的文字和代码数据进行训练。蓝心大模型软件的体验入口在哪呢,这里我们来看下蓝心大模型的官方体验入口。 >>>点击前...
-
中国版chatGPT【文心一言】
文心一言是一款基于人工智能技术的中文自然语言处理工具,它可以用于文本生成、情感分析、关键词提取等多种应用场景。相比于GPT等其他自然语言处理模型,文心一言有着更多的优势。 首先,文心一言具有更高的准确率和可靠性。它采用了最新的深度学习算法和大规模数据集...
-
ChatGPT模型在神经学考试中表现出色,超越人类学生水平
近期发表在JAMA Network Open期刊的一项研究中,研究人员评估了两个ChatGPT大型语言模型(LLMs)在回答美国精神病学和神经学委员会问题库的问题时的表现。他们比较了这两个模型在低阶和高阶问题上的结果与人类神经学生的表现。研究发现,其中一个...
-
零一万物Yi-34B-Chat微调模型上线,登陆多个权威榜单
最近,业内众多大模型基准又迎来了一轮 “实力值” 更新。 继 11 月初零一万物发布 Yi-34B 基座模型后,Yi-34B-Chat 微调模型在 11 月 24 日开源上线 ,短时间登陆了全球多个英文、中文大模型权威榜单,再度获得了全球开发者的关注。...
-
像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略
随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。 一方面,为了高其在目标任务的性能表现,研究者会收集和构建目标任务数据集并对大语言模型(LLM)进行微调,但这种方式通常会导致除目标任务...
-
直追GPT-4!李开复Yi-34B新成绩公布:94.08%的胜率超越LLaMA2等主流大模型
仅次于GPT-4,李开复零一万物Yi-34B-Chat最新成绩公布—— 在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT! 图片 不仅如此,在加州大学伯克利分校主导的LMSYS...
-
外包数据注释服务如何增强人工智能模型?
在人工智能(AI 和机器学习(ML 领域,基础在于数据,数据的质量、准确性和深度直接影响人工智能系统的学习和决策能力。数据有助于丰富机器学习算法数据集的数据注释服务,对于教导AI系统识别模式、做出预测和提高整体性能至关重要。 通过高质量数据注释为ML模...
-
LLM-SFT,新微调数据集-MWP-Instruct(多步计算 + 一、二元方程),微调Bloom, ChatGLM, LlaMA(支持QLoRA, TensorBoardX)
LLM-SFT 中文大模型微调(LLM-SFT , 支持模型(ChatGLM, LlaMA, Bloom , 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX , 支持(微调, 推理, 测评, 接口 等. 项目...
-
使边缘人工智能真正实现变革
边缘人工智能的采用在众多行业中呈上升趋势。随着这种趋势的持续下去,其将不仅为企业而且为社会带来变革。 边缘计算的去中心化方法减轻了数据拥塞、连接故障和传输成本等限制。这极大地提高了人工智能应用程序的性能,从而可以更快、更可靠地做出决策。 边缘人工智能的...
-
除了《AI 法案》,欧盟还将对 GPT-4 等更高能力模型增加额外规则约束
12 月 10 日消息,本周末,欧盟就全球首个 AI 监管法案“AI Act”达成初步协议,涉及包括 ChatGPT 在内的通用人工智能系统,这被视为世界上第一个全面监管 AI 的关键一环。 综合《财富》杂志、彭博社当地时间周六晚上报道,根据彭博社获得...
-
把检测器加进来,YOLOv8部署实战!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 0 把检测器加进来 本文是我在学习韩博《CUDA与TensorRT部署实战课程》第六章的课程部分输出的个人学习笔记,欢迎大家一起讨论学习! 1 导出onnx需要注意的地方 不要pip instal...
-
分分钟将图像转换成3D模型
译者 | 布加迪 审校 | 重楼 法国LIGM实验室的研究人员已开发了一种新颖的技术,可以由真实场景周围捕获的图像集合快速创建高度逼真的3D网格模型。他们的方法被称为SuGaR,通过以一种独特的方式采用神经表示和计算几何技术,可以在短短几分钟内重新构建...
-
【AIGC】Stable Diffusion原理快速上手,模型结构、关键组件、训练预测方式
【AIGC】Stable Diffusion的建模思想、训练预测方式快速 在这篇博客中,将会用机器学习入门级描述,来介绍Stable Diffusion的关键原理。目前,网络上的使用教程非常多,本篇中不会介绍如何部署、使用或者微调SD模型。也会尽量精简...