llama2 第8页 - AIGC资讯

ChatGPT 挂了一整天了，已经习惯了用大模型的我怎么办

OpenAI 挂了，已经习惯了用大模型的我怎么办 OpenAI 挂了，急，在线等。你是不是已经习惯了 ChatGPT 的存在？是不是感觉离了 ChatGPT 寸步难行，很难再进行自己的工作？今天 ChatGPT 大面积宕机，服务直到文章发布（下午5点...

大数据 2023-11-09 人工智能

1113阅读

大模型使用——超算上部署LLAMA-2-70B-Chat

大模型使用——超算上部署LLAMA-2-70B-Chat 前言1、本机为Inspiron 5005，为64位，所用操作系统为Windos 10。超算的操作系统为基于Centos的linux，GPU配置为A100，所使用开发环境为Anaconda。2、...

AIGC 2023-11-09 人工智能

938阅读

IBM设立5亿美元风险基金用以投资AI初创公司

IBM宣布成立了一项5亿美元的企业AI风险基金，旨在投资各类人工智能公司，从初创企业到高增长企业不等。这一举措是IBM在人工智能领域的最新投资，旨在推动企业领域的生成式人工智能（GenAI）技术研究和发展。 IBM的企业AI风险基金的目标是加速企业领域的...

人工智能 2023-11-09 人工智能

924阅读

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微

LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO 训练+DPO 训练】的简介、...

人工智能 2023-11-08 人工智能

1153阅读

中文大语言模型 Llama-2 7B（或13B）本地化部署（国内云服务器、GPU单卡16GB、中文模型、WEB页面TextUI、简单入门）

本文目的是让大家先熟悉模型的部署，简单入门；所以只需要很小的算力，单台服务器单GPU显卡（显存不低于12GB），操作系统需要安装 Ubuntu 18.04。 1 服务器&操作系统 1.1服务器的准备...

生成式AI 2023-11-08 人工智能

1460阅读

深度解析 Llama 2 的资源汇总：不容错过

“ 探索 Llama 2 背后的过程，包括了模型的全面解析，在线体验，微调，部署等，这份资源汇总将带您深入了解其内涵。” 01 — 周二发布了文章《中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用》后，不少朋...

人工智能 2023-11-08 人工智能

1007阅读

万万没想到，我用文心一言开发了一个儿童小玩具

最近关注到一年一度的百度世界大会今年将于10月17日在北京首钢园举办，本期大会的主题是“生成未来（PROMPT THE WORLD）”。会上，李彦宏会做主题为「手把手教你做AI原生应用」的演讲，比较期待 Robin 会怎么展示。据说，大会当天百度还会发布文...

人工智能 2023-11-08 人工智能

906阅读

马毅、沈向洋联手，首届CPAL开奖！16人获新星奖，华人学者占据半壁江山

就在昨天，首届CPAL简约学术会议，正式公布了新星奖获奖者名单！ CPAL专注于解决机器学习、信号处理、优化等领域中普遍存在的简约、低维结构问题，并探索低维结构在智能硬件与系统、交叉科学和工程等新兴方向的应用。创办这个会议的出发点，就是将其设计为一个...

人工智能 2023-11-07 人工智能

857阅读

AI视野：OpenAI发布GPT-4Turbo；xAI推出PromptIDE工具；美团首个AI产品“Wow”亮相；百家号AI笔记功能将下线

???AI新鲜事 OpenAI发布GPT-4Turbo和自定义GPTs服务在OpenAI首届开发者大会DevDay活动上，OpenAI发布了GPT-4Turbo模型和自定义GPTs服务，以及其他新功能和API，如Assistants API和新的模态AP...

AIGC 2023-11-07 人工智能

869阅读

联发科发布天玑9300生成式AI移动芯片支持运行330亿参数大模型

昨日晚间，联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片，采用台积电第三代4nm 制程。该芯片预计于2023年底上市。这款芯片采用全大核架构设计，提供高智能、高性能、高能效、低功耗的特性，为用户带来卓越的生成式 AI 体验。天玑9300采...

AIGC 2023-11-07 人工智能

828阅读

让大模型忘记哈利波特，微软新研究上演Llama 2记忆消除术，真·用魔法打败魔法（doge）

最近微软一项研究让Llama 2选择性失忆了，把哈利波特忘得一干二净。现在问模型“哈利波特是谁？”，它的回答是这样婶儿的：木有赫敏、罗恩，木有霍格沃茨…… 要知道此前Llama 2的记忆深度还是很给力的，比如给它一个看似非常普通的提示“那年秋天，哈...

人工智能 2023-11-07 人工智能

754阅读

李开复领队开源大模型 Yi，40万字上下文窗口破纪录

由李开复博士亲自下场创办的零一万物（01.ai），自3月底官宣成立后，于近日发布并开源了两个版本的中英文大模型 Yi-6B 和 Yi-34B。在线上发布环节，李开复博士重点介绍了 Yi 系列大模型的三处性能亮点: 全球最长200K 上下文窗口，免费开...

AIGC 2023-11-06 人工智能

983阅读

DB-GPT:使用专有LLM技术改变与数据库互操作的方式

DB-GPT是一个开源项目，旨在改变与数据库的互操作方式，它采用了本地化的大型GPT模型，为处理各种数据库相关情境提供了全面的解决方案。这个工具强调了隐私和数据安全，通过业务模块的定制化实施和分割，确保了LLM功能的完全机密性、安全性和可管理性。随着大...

AIGC 2023-11-06 人工智能

1194阅读

国内最大开源模型发布，无条件免费商用！参数650亿，基于2.6万亿token训练

国内规模最大的开源大模型来了：参数650亿、基于2.6-3.2万亿token训练。排名仅次于“猎鹰”和“羊驼”，性能媲美GPT3.5，现在就能无条件免费商用。它就是来自深圳元象公司的XVERSE。根据算力、资源限制和具体任务需求的不同，我们能对...

人工智能 2023-11-06 人工智能

850阅读

马斯克版ChatGPT爆火来袭！不用Python，11人爆肝两个月

马斯克突然出手截胡，抢在OpenAI开发者大会前发布大模型Grok。与其他ChatGPT类产品不同，Grok可以实时从?推文中获取最新知识，比如马斯克刚刚与Joe Rogan的最新访谈。图片巨量、实时且独特的?数据构成了Grok的最大护城河，早在7...

AIGC 2023-11-06 人工智能

843阅读

李开复称其创立的AI公司零一万物估值已超10亿美元发布大模型Yi-34B

此前，李开复成立了一家初创公司，名为零一万物（01.AI），旨在为中国市场开发本土大型语言模型（LLM）。日前，李开复在接受采访时解释了创建零一万物的动机:“我认为需求是创新之母，在中国显然存在巨大的需求。与世界其他地方不同，中国无法使用OpenAI和Go...

AIGC 2023-11-06 人工智能

863阅读

中科院物理研究所等发布材料合成AI大语言模型MatChat

近期，中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作，通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程，将数据处理为13878条高可信度的合成路径描述数据，并对开源大语言模型LLaMA2-7B进行微调训练，研发了专...

AIGC 2023-11-06 人工智能

790阅读

字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径！把李沐都炸出来了

GPT-3究竟是如何进化到GPT-4的？字节给OpenAI所有大模型来了个“开盒”操作。结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。比如： SFT是早期GPT进化的推动者帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...

AIGC 2023-11-05 人工智能

836阅读

隐私浏览器Brave发布“匿名且安全”AI聊天机器人Leo 承诺不用户数据训练AI

隐私导向的浏览器Brave最近推出了名为Leo的本地AI助手，该公司声称相比其他AI聊天机器人服务，Leo提供了“无与伦比的隐私”。经过数月的测试，Leo现在可供所有运行浏览器版本1.60的Brave桌面用户免费使用，而且将在未来几个月内分阶段推出到An...

AIGC 2023-11-03 人工智能

805阅读

AI安全辩论：Sam Altman剑桥演讲遭抵制、Llama 2被曝存在潜在风险

当前，全球正掀起一场激烈的AI安全讨论，其中三个关键要点引起广泛关注。首先，OpenAI的CEO Sam Altman在剑桥举办的活动中遭到了抵制，抗议者要求停止AI竞赛，导致全球AI安全讨论再次升级。不仅如此，AI巨头分为两派，一派是「开源派」，包括L...

人工智能 2023-11-02 人工智能

833阅读

通义千问2.0首发！云计算的“第三次浪潮”来了

10月31日，2023云栖大会在杭州的云栖小镇如期开幕。《天下网商》从开幕日获悉，今年的云栖大会有两大“回归”，一是阿里云创始人王坚回来了，二是大会主题“计算，为了无法计算的价值”，让人不由联想到8年前的大会主题“为了无法计算的价值。” 2015年，云计...

人工智能 2023-11-02 人工智能

835阅读

AI视野：英伟达发布大模型ChipNeMo；百度推出文心一言会员；OpenAI潜入黑客群聊；微软AI助手Copilot上线

????大模型动态英伟达发布430亿参数大模型ChipNeMo 英伟达发布了拥有430亿参数的大语言模型ChipNeMo，专注于辅助芯片设计，提高工程师的工作效率，支持问答、EDA脚本生成和Bug总结等任务。 vivo发布AI蓝心大模型并宣布开源7B...

AIGC 2023-11-01 人工智能

1037阅读

阿里云全面升级AI基础设施，中国大模型公司一半跑在阿里云上！

10月31日，在2023云栖大会上，阿里云CTO周靖人表示，面向智能时代，阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新，升级云计算体系，打造一朵AI时代最开放的云。在现场，周靖人公布了云计算基础能力的最新进展，升级了人工智能平台，并发布千亿...

人工智能 2023-10-31 人工智能

866阅读

AI玩推理桌游一眼识破骗局！清华通院联合推出心智理论新框架，六个指标评估表现均明显优于思维链

清华自动化系团队联合北京通用人工智能研究院，让几个AI智能体玩起了桌游！游戏名叫阿瓦隆，是一个策略性的社交推理游戏，玩家被隐秘地分为“正义”与“邪恶”两派，通过任务投票、互相猜测与欺骗来完成或阻止任务，最终确定胜负。为了能让AI智能体成功识别并应...

AIGC 2023-10-31 人工智能

910阅读

通义千问有没有app？通义千问api接口文档在哪里找

在 10 月 31 日的 2023 云栖大会上，阿里云CTO周靖人宣布阿里云将全面升级云计算体系，打造一个面向AI时代最开放的云，涵盖从底层算力到AI平台再到模型服务的全栈技术创新。目前，中国有一半的大模型企业运行在阿里云上， 280 万AI开发者活跃在阿...

AIGC 2023-10-31 人工智能

958阅读

Meta AI研究负责人倡导开源许可制度变革

Meta公司最近发布的大型语言模型Llama2备受争议，因其并未完全满足开源倡议的要求。尽管Llama2相对较为开放和免费，但在开源软件领域，一些人仍对该公司的开放性持有异议。具体来说，Meta公司的许可协议使Llama2对许多人免费，但它仍然是有限的，...

人工智能 2023-10-31 人工智能

925阅读

最好7B模型再易主！打败700亿LLaMA2，苹果电脑就能跑

花500刀“调教”的70亿参数模型，打败700亿参数的Llama 2！且笔记本就能轻松跑，效果媲美ChatGPT。重点：免费、不要钱。 HuggingFace H4团队打造的开源模型Zephyr-7B，鲨疯了。其底层模型是前段时间爆火、由有着“欧...

AIGC 2023-10-29 人工智能

1159阅读

马克·扎克伯格的 Meta 发布 Llama2 以针对 Sam Altman 及 OpenAI 展开竞争

自 5 月份在白宫举行的顶级 AI CEO 聚会上，Sam Altman 与 Satya Nadella 和 Sundar Pichai 并排而坐以来，马克·扎克伯格的缺席成为了不容忽视的事实。在 Alphabet、微软和 OpenAI 的参与下，扎...

人工智能 2023-10-29 人工智能

961阅读

ChatGPT企业版，基本凉了！

撰稿 | 言征出品 | 51CTO技术栈（微信号：blog51cto） OpenAI 财报发布了，年化营收达到了13亿美元，平均每月营收超1亿美元，但或许创始人 Sam Altman，高兴不起来。因为，大部分收入的信心还是用户端。据现在客户的反馈看，...

人工智能 2023-10-27 人工智能

859阅读

高通发布骁龙8 Gen 3 专注于生成式AI功能

根据mspoweruser.com获得的内部文件泄漏信息显示，高通计划发布其最新的旗舰移动平台，骁龙8Gen3，专为生成式人工智能而设计。图源备注：图片由AI生成，图片授权服务商Midjourney 根据文件，这款新芯片可以运行拥有超过100亿参数的A...

人工智能 2023-10-24 人工智能

870阅读

一文读懂全新深度学习库Rust Burn

一、什么是Rust Burn？ Rust Burn是一个全新的深度学习框架，完全使用Rust编程语言编写。创建这个新框架而不是使用现有框架（如PyTorch或TensorFlow）的动机是为了构建一个适应多种用户需求的通用框架，包括研究人员、机器学习工程...

AIGC 2023-10-24 人工智能

1930阅读

百度大模型加持，元宇宙竟然还能「卷」出新玩法！AI一键作画、智能NPC秒回

【新智元导读】元宇宙，竟然还能卷出新玩法?这次，乘着大模型的快车，百度又在元宇宙里开启了不一样的极致体验。乘着大模型的浪潮，元宇宙再度升级! 2023年的元宇宙看似冷静，实则回归理性，当营销噱头与泡沫一一褪去，留存下来的，都是真正的玩家。就在前不久，无...

人工智能 2023-10-23 人工智能

1005阅读

百川VS智谱，谁是中国的OpenAI？

6月初，外媒曾发出了“谁是中国的OpenAI”的拷问，经历了大模型创业潮之后，大浪淘沙，最终留下的不过寥寥数人。清华大学几个十字路口外的赛尔大厦，是明星创业者王小川的百川智能，搜狐网络大厦是学院派出身的智谱AI。二者在经历了市场的检验后，成为了最有希望的...

AIGC 2023-10-23 人工智能

940阅读

LLaMA2上下文长度暴涨至100万tokens，只需调整1个超参数

只需微调一下，大模型支持上下文大小就能从1.6万tokens延长至100万？！还是在只有70亿参数的LLaMA 2上。要知道，即使是当前最火的Claude 2和GPT-4，支持上下文长度也不过10万和3.2万，超出这个范围大模型就会开始胡言乱语、记不...

AIGC 2023-10-23 人工智能

1058阅读

“大模型+”应用落地时，大模型微调如何兼顾效果、成本和可控性？

10月17日，老牌科技巨头百度“文心大模型4.0”的发布，让原本暗潮汹涌的百模大战再次白热化。伴随着越来越多基础大模型迭代速度的日益加快，“大模型+”的应用拐点正在到来。纵观全球市场，预计到2030年，AIGC市场规模将超过万亿人民币，巨大的市场潜力，吸...

人工智能 2023-10-23 人工智能

1083阅读