-
由谷歌著名人工智能论文两位共同作者创立的 Essential AI 获得 5700 万美元融资
据彭博新闻报道,由两位谷歌资深人士创立的人工智能初创公司 Essential AI 已从隐秘状态中浮现,获得了 5650 万美元的新融资。 Essential AI 开发了一项名为「企业大脑」的技术,该技术可以利用 AI 执行企业职能,如数据分析,并自动...
-
微软发文:27 亿参数的 Phi-2 AI 模型性能优于谷歌 32 亿参数的 Gemini Nano-2
12 月 13 日消息,微软公司今天发布新闻稿,表示旗下的 Phi-2 2.7B 模型,在多个方面都优于谷歌发布的 Gemini Nano-2 3.2B。 Phi-2 2.7B 模型 IT之家今年 11 月报道,微软在 Ignite 2023 大会上,宣...
-
Cohere发布“构建自己的连接器” 助企业利用Slack、Google Drive数据构建AI
近日,Cohere发布了“构建自己的连接器(build-your-own connectors)”功能,该功能允许企业安全地连接存储在Slack、Google Drive等第三方应用上的公司数据到其大型语言模型(Command LLM 。据称,这是一项独特...
-
LLaMA及其子孙模型概述
文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽 骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性,对...
-
llama.cpp部署通义千问Qwen-14B
llama.cpp是当前最火热的大模型开源推理框架之一,支持了非常多的LLM的量化推理,生态比较完善,是个人学习和使用的首选。最近阿里开源了通义千问大语言模型,在众多榜单上刷榜了,是当前最炙手可热的开源中文大语言模型。今天在github上看到前几天llam...
-
LLM-LLaMA中文衍生模型:Chinese-LLaMA-Alpaca【扩充词表、Lora部分参数预训练、微调】
GitHub:GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 中文LLaMA模型...
-
【Video-LLaMA】增强LLM对视频内容的理解
Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understanding》 Authors: Hang Zhang, Xin Li, Lid...
-
LLMs之Chinese-LLaMA-Alpaca-2:源码解读(run_clm_pt_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的chec
LLMs之Chinese-LLaMA-Alpaca-2:源码解读(run_clm_pt_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数据...
-
【云上探索实验室】编程范式变革进行时——CodeWhisperer实践全流程及测评分析报告
目录 一、基于LLM的辅助编程——编程范式变革进行时 二、CodeWhisperer + VS Code 安装与配置 2.1、扩展安装 2.2、配置 三、CodeWhisperer实践全流程 3.1、CodeWhisperer基础实验...
-
训练自己的Llama 2!大模型微调技术介绍
训练自己的Llama 2!大模型微调技术介绍 趋动云 趋动云是面向 AI 算法工程师的开发平台,为工程师提供模型开发、模型训练、数据和代码管理等功能。 近期有不少粉丝问算力君,趋动云是否支持大模型的训练?当然支持! 最近大火的Llama...
-
专家表示:OpenAI的Q* 可能在某些活动中 “比任何人都更好”
Q* 近日,有关OpenAI可能实现人工智能突破的猜测愈演愈烈,这一被称为Q*的潜在突破被认为可能在某些活动中“超越任何人”。Xenesis创始人兼首席科学家Tirath Virdee在接受Yahoo Finance UK采访时表示,Q*的发展有望使人工智...
-
ChatGPT的训练数据可以通过“偏离攻击”进行泄露
ChatGPT等大语言模型(LLM)使用来自图书、网站及其他来源的海量文本数据进行训练,通常情况下,训练它们所用的数据是一个秘密。然而,最近的一项研究揭示:它们有时可以记住并反刍训练它们所用的特定数据片段。这个现象名为“记忆”。 随后,来自谷歌Deep...
-
智谱AI发布中文 LLM 对齐评测基准AlignBench
智谱AI发布了专为中文大语言模型(LLM)而生的对齐评测基准AlignBench,这是目前第一个针对中文大模型的评测基准,能够在多维度上细致评测模型和人类意图的对齐水平。 AlignBench 的数据集来自于真实的使用场景,经过初步构造、敏感性筛查、参考答...
-
AI视野:Pika1.0首批用户资格揭晓;Runway官宣下场通用世界模型;妙鸭相机推出AI修图;抖音正式上线AI创作功能
???AI新鲜事 Pika1.0首批用户资格揭晓 Pika Labs最新视频生成产品Pika1.0引起轰动,已开始向候补名单用户发放使用资格。Pika1.0以文生成视频为特色,提供3秒视频快速生成、背景修改等功能。用户可在推特或邮箱确认是否成为首批体验者。...
-
2024年AI趋势看这张图,LeCun:开源大模型要超越闭源
2023 年即将过去。一年以来,各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时,另一方「势力」悄然崛起 —— 开源。 开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀?是否能够媲美专有模型的性能?迄今为止,我们一直还只能说...
-
开源大模型超越GPT-3.5!爆火MoE实测结果出炉,网友:OpenAI越来越没护城河了
一条神秘磁力链接引爆整个AI圈,现在,正式测评结果终于来了: 首个开源MoE大模型Mixtral 8x7B,已经达到甚至超越了Llama 2 70B和GPT-3.5的水平。 (对,就是传闻中GPT-4的同款方案。) 并且由于是稀疏模型,处理每个toke...
-
UCLA推出Chameleon框架 大模型表格数学推理准确率达98.78%
在NeurIPS2023上,UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具,包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块,解决了大型语言模型在实时信息获取和数学推理方面的不足。 Chameleon的核...
-
构建更好的基于LLM的应用程序的四大秘诀
作者 | Adrien Treuille 译者 | 布加迪 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 自从OpenAI发布首个ChatGPT模型以来,人们对生成式AI的兴趣激增。基于大语言模型(LLM)的应用程序现处于企业...
-
表格数学推理准确率达98.78%!UCLA推出全新「变色龙推理框架」
在自然语言处理任务中取得显著成就的大型语言模型(LLMs)尽管表现出色,但在实时信息获取、外部工具利用和精确数学推理方面仍显不足。 为了应对这些挑战,来自UCLA等机构的研究人员打造了全新的Chameleon框架,其独特的即插即用模型融合了多种工具,包括...
-
Runway官宣下场通用世界模型!解决视频AI最大难题,竟靠AI模拟世界?
【新智元导读】Runway突然发布公告,宣称要开发通用世界模型,解决AI视频最大难题,未来要用AI模拟世界。 最近AI视频赛道的Pika1.0大火,两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的发展成果。 面对Pika的步步紧逼,本以为R...
-
467亿参数MoE追平GPT-3.5!爆火开源Mixtral模型细节首公开,中杯逼近GPT-4
今天,Mistral AI正式放出了Mixtral 8x7B的技术细节—— 在大多数基准测试中,Mixtral的表现不仅优于Llama 2 70B,而且推理速度提高了整整6倍! 尤其是,它在大多数标准基准测试上与GPT-3.5打平,甚至略胜一筹。 新开源...
-
阿里研究部门推出了专为东南亚量身定制的AI大模型SeaLLM
阿里巴巴集团旗下研究机构达摩院推出了专为东南亚语言量身定制的人工智能(AI)大语言模型(LLM ,凸显了该公司在更广泛地区发展市场的雄心。 阿里巴巴研究部门表示,东南亚LLM(SeaLLM)在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅...
-
当GPT-4V充当机器人大脑,可能你都没AI会规划
GPT-4V 已经能帮我们设计网站代码,控制浏览器,这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢? 最近,来自清华大学交叉信息研究院的研究者提出「ViLa」算法,实现了让 GPT-4...
-
为Gemini AI大模型找场景 谷歌Project Ellman项目曝光
谷歌团队提出一个设想,用AI技术处理用户照片及搜索引擎查询信息,全面分析出用户的生活是怎样的,这个项目名叫“Project Ellmann”。 按照最初的设想,Project Ellmann会用LLM(比如Gemini)提取信息,从用户的照片中找到特定...
-
LLM之Prompt(二):清华提出Prompt 对齐优化技术BPO
论文题目:《Black-Box Prompt Optimization: Aligning Large Language Models without Model Training》 论文链接:https://arxiv.org/abs/2311.041...
-
微软视频编辑工具 Clipchamp 迎来新功能,包含 AI 自动创作、AI 文本转语音
IT之家 12 月 12 日消息,微软于 2021 年收购了 Clipchamp,这是一款易于使用的基于 Web 的视频编辑工具。随后,Clipchamp 被纳入 Microsoft 365 个人版和家庭版订阅计划中。最近,微软将 Clipchamp 扩...
-
OpenAI 宣布近期修复 GPT-4“变懒”问题,将在离线评估及 A / B 测试后更新模型
IT之家 12 月 12 日消息,OpenAI 在上周遭到部分用户投诉,许多用户声称,他们在使用 ChatGPT 或 GPT-4 API 时,会遇到回应速度慢、敷衍回答、拒绝回答、中断会话等一系列问题,OpenAI 承认了这一事实,并在声称将彻底、妥当...
-
如何用文心一言开发前端代码
随着chatGPT的火爆,大家越来越认识到到语言大模型的潜力,国内的类chatGPT的生成式语言大模型(LLM)也如雨后春笋般冒出来。 如今大家都在探索各种prompt的技巧,其实从我个人看来,LLM其实也是一种检索模型,只不过它的检索粒度更加细致,更加语...
-
研究人员发出警告:ChatGPT 不适合获取医疗信息,可能会误导公众
IT之家 12 月 11 日消息,一项新的研究显示,ChatGPT 可能并不适合用来获取医疗信息。 长岛大学的研究人员向 ChatGPT 询问了 39 个与药物相关的问题,这些问题都是来自该大学药学院药物信息服务中心的真实问题。随后,他们将 ChatG...
-
ChatGPT 已经成为过去,在您的笔记本电脑中免费运行 Llama 2(源码含模型)
指示: 现在您可以在计算机本地运行 ChatGPT 和 LLaMA-2。Meta刚刚发布了这个拥有700亿参数的模型,比任何其他Open模型都要好,甚至击败了Falcon 40B! 为此,您需要打开终端,转到项目文件夹,然后 git clone ll...
-
ChatGPT模型在神经学考试中表现出色,超越人类学生水平
近期发表在JAMA Network Open期刊的一项研究中,研究人员评估了两个ChatGPT大型语言模型(LLMs)在回答美国精神病学和神经学委员会问题库的问题时的表现。他们比较了这两个模型在低阶和高阶问题上的结果与人类神经学生的表现。研究发现,其中一个...
-
夸张!EMNLP投稿近5000篇,奖项出炉:北大、腾讯摘最佳长论文
EMNLP 是自然语言处理领域的顶级会议之一,EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。 因为今年 ChatGPT 的爆火带动大模型、NLP 概念,EMNLP 2023 的投稿论文数量也达到近 5000 篇,甚至略高于 AC...
-
像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略
随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。 一方面,为了高其在目标任务的性能表现,研究者会收集和构建目标任务数据集并对大语言模型(LLM)进行微调,但这种方式通常会导致除目标任务...
-
LLM-SFT,新微调数据集-MWP-Instruct(多步计算 + 一、二元方程),微调Bloom, ChatGLM, LlaMA(支持QLoRA, TensorBoardX)
LLM-SFT 中文大模型微调(LLM-SFT , 支持模型(ChatGLM, LlaMA, Bloom , 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX , 支持(微调, 推理, 测评, 接口 等. 项目...
-
戴尔技术推动AI与生成式AI策略,存储技术加速前行
戴尔技术近日宣布,通过引入新的企业数据存储技术,与Nvidia DGX SuperPod AI基础设施进行验证,助力客户实现更快的AI和生成式AI性能。戴尔 Technologies基础设施解决方案集团总裁Arthur Lewis表示:“存储性能对于成功的...
-
除了《AI 法案》,欧盟还将对 GPT-4 等更高能力模型增加额外规则约束
12 月 10 日消息,本周末,欧盟就全球首个 AI 监管法案“AI Act”达成初步协议,涉及包括 ChatGPT 在内的通用人工智能系统,这被视为世界上第一个全面监管 AI 的关键一环。 综合《财富》杂志、彭博社当地时间周六晚上报道,根据彭博社获得...
-
LangChain开源AnythingLLM:可与任何内容聊天的私人ChatGPT
今日,LangChain正式开源全栈应用程序AnythingLLM,为用户提供了构建私有ChatGPT的便利。无论是使用商业的现成LLM(Large Language Models),还是流行的开源LLM和VectorDB解决方案,您都可以轻松地在本地或远...
-
欧盟就监管生成式 AI 工具达成初步协议:迄今为止同类“最全面”规则
12 月 9 日消息,综合《华盛顿邮报》、Engadget 等外媒报道,在世界各地争相应对 AI 快速发展带来的风险之际,欧盟官员当地时间周五达成了一项具有“里程碑意义”的协议 ——《人工智能法案》(AI Act)的临时协议。这将是该地区对 AI 最全...
-
谷歌发布Cloud TPU v5p和AI超级计算机:人工智能处理能力飞跃
谷歌在推出其张量处理单元Cloud TPU v5p和具有突破性的超级计算机架构AI Hypercomputer时掀起了轩然大波。这些创新的发布,再加上资源管理工具Dynamic Workload Scheduler,标志着在处理组织的人工智能任务方面迈出了...
-
杭州一公司开出20万月薪/320万年薪抢人!ChatGPT掀起AI热潮,AIGC人才被爆抢
5年工作经历,博士学位,最高月薪20万。 最近,位于杭州未来科技城一家公司,开出了最高320万年薪,招聘AIGC方向算法工程师一名。 ChatGPT在全球掀起了AI热潮,国内互联网大厂纷纷加入战局打造国内版ChatGPT。很多人在担心失业的同时,AI人...
-
2023人工智能工程五大新方向
除了LLM的大量增加,AI开发工具也有了扩展。我们来看一下今年AI开发中的五个关键趋势。 译自Top 5 AI Engineering Trends of 2023,作者 Richard MacManus 是The New Stack的高级编辑,专注于W...
-
基于 AIGC,RocketMQ 学习社区探索开源软件学习新范式
AIGC 持续火爆全球,越来越多的场景开始接入并体现非凡的价值。其中应用广泛的场景之一就是智能知识问答,它改变了人们学习的方式,从阅读式到问答式,让知识的获取更加精准有效。开源软件拥有着广泛的求知群体,AIGC+ 社区的结合是学习型社区未来演进...
-
京东AIGC实战项目复盘;第一门AI动画系统课程;百川智能启动2024校园招聘;Kaggle 2023 AI前沿报告 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 李彦宏宣布「文心大模型4.0」正式发布,并开启邀请测试 10月17日,李彦宏在百度世界2023上宣布「文心大模型4.0」正式发布,表示这是迄今为止最强...
-
导出LLaMA ChatGlm2等LLM模型为onnx
通过onnx模型可以在支持onnx推理的推理引擎上进行推理,从而可以将LLM部署在更加广泛的平台上面。此外还可以具有避免pytorch依赖,获得更好的性能等优势。 这篇博客(大模型LLaMa及周边项目(二) - 知乎)进行了llama导出onnx的开创性...
-
一条磁力链接席卷AI圈,87GB种子直接开源8x7B MoE模型
「高端」的开源,往往采用最朴素的发布方式。 昨天,Mistral AI 在 X 平台甩出一条磁力链接,宣布了新的开源动作。 没有长篇官方博客,没有刻意加速的 Demo,这家公司算是当下大模型领域的「一股清流」。 打开一看,发现是接近 87 GB 的种子...
-
一文读懂常用的 “生成式 AI 框架”
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - Gen AI ,即“生成式 AI” 技术。 随着 AI 技术的不断发展,Gen AI 的力量超越了单纯的技术奇迹,更是一种具有变革性的动态力量,深刻地塑造了...
-
大模型就是「造梦机」,Karpathy一语惊人!人类才是「幻觉问题」根本原因
幻觉,早已成为LLM老生常谈的问题。 然而,OpenAI科学家Andrej Karpathy今早关于大模型幻觉的解释,观点惊人,掀起非常激烈的讨论。 在Karpathy看来: 另外,Karpathy的另一句话,更是被许多人奉为经典。他认为,与大模型相对的...
-
LLaMA Adapter和LLaMA Adapter V2
LLaMA Adapter论文地址: https://arxiv.org/pdf/2303.16199.pdf LLaMA Adapter V2论文地址: https://arxiv.org/pdf/2304.15010.pdf LLaMA Ada...
-
Koala:加州大学BAIR团队使用ChatGPT蒸馏数据和公开数据集微调LLaMA模型得到
自从Meta发布LLaMA以来,围绕它开发的模型与日俱增,比如Alpaca、llama.cpp、ChatLLaMA以及Vicuna等等,相关的博客可以参考如下: 【Alpaca】斯坦福发布了一个由LLaMA 7B微调的模型Alpaca(羊驼),训练3小时...
-
首个开源MoE大模型发布!7Bx8个专家,离GPT-4最近的一集
“取消今晚所有计划!”,许多AI开发者决定不睡了。 只因首个开源MoE大模型刚刚由Mistral AI发布。 MoE架构全称专家混合(Mixture-of-Experts),也就是传闻中GPT-4采用的方案,可以说这是开源大模型离GPT-4最近的一集...