语言模型第57页

基于llama模型进行增量预训练

目录 1、llama模型转换(pytorch格式转换为HuggingFace格式 1.1、拉取Chinese-LLaMA-Alpaca项目 1.2、准备文件夹 1.3、下载llama官方原始模型 1.4、移动文件到指定位置 1.5、执行转换脚...

生成式AI 2023-11-21 人工智能

1301阅读

深入理解LLaMA, Alpaca, ColossalChat 系列模型

知乎：紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca：大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...

AIGC 2023-11-21 人工智能

996阅读

大语言模型-中文chatGLM-LLAMA微调

微调大语言模型-ChatGLM-Tuning大语言模型-微调chatglm6b大语言模型-中文chatGLM-LLAMA微调大语言模型-alpaca-lora 本地知识库大语言模型2-document ai解读大语言模型-DocumentSearch解...

AIGC 2023-11-21 人工智能

832阅读

大语言模型之七- Llama-2单GPU微调SFT

（T4 16G）模型预训练colab脚本在github主页面。详见Finetuning_LLama_2_0_on_Colab_with_1_GPU.ipynb 在上一篇博客提到两种改进预训练模型性能的方法Retrieval-Augmented Gener...

人工智能 2023-11-21 人工智能

1040阅读

北大视频大模型新SOTA，搞笑抖音视频AI秒懂笑点

AI能理解搞笑视频笑点在哪里了。 AI回答：这个视频之所以搞笑，在于一个小宝宝正坐在床上努力读书，但他显然还不会真正读书。他只是不停地指着书页上的各处，而摄影者则在背后笑他。小宝宝的这种尝试很有趣，因为他在尝试阅读一本对他而言过大的书，也看不懂里面的文...

大数据 2023-11-20 人工智能

778阅读

AI「cosplay」关键在人设！复旦、人大等发布大五人格+MBTI测试：特质还原率达82.8%，拒绝OOC

想和喜欢的动漫小说角色聊天？想要一个虚拟伴侣？想要自己的数字智能体？随着大语言模型（Large Language Models, LLM）的发展，这些过去的幻想似乎越来越近了。 Character AI、Chat 凉宫春日、病娇AI女友模拟器……基于大...

大数据 2023-11-20 人工智能

1291阅读

中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT

中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型（LLM）。该模型基于封神榜团队的 Ziya2-13B 模型构建，拥有130亿个参数，并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的...

生成式AI 2023-11-20 人工智能

883阅读

ChatGLM-LLaMA-chinese-insturct 学习记录（含LoRA的源码理解）

ChatGLM-LLaMA-chinese-insturct 前言一、实验记录 1.1 环境配置 1.2 代码理解 1.2.1 LoRA 1.4 实验结果二、总结前言介绍：探索中文instruct数据在C...

人工智能 2023-11-20 人工智能

811阅读

LLM - Model Load_in_8bit For LLaMA

一.引言 LLM 量化是将大语言模型进行压缩和优化以减少其计算和存储需求的过程。博主在使用 LLaMA-33B 时尝试使用量化加载模型，用传统 API 参数控制量化失败，改用其他依赖尝试成功。这里先铺下结论: ◆ Load_in_8bit ✔️...

人工智能 2023-11-20 人工智能

1171阅读

研究证实，最好的 ChatGPT 提示是高度情绪化的

一组研究人员发现，充满情感的LLM输入始终会产生更有用的反应。对不同大型语言模型响应输入方式的新研究表明，确保您的ChatGPT 提示足够情绪化将帮助您从聊天机器人中提取最高质量的响应。这些发现提出了一个问题，即ChatGPT是否已经发展成为通用人...

生成式AI 2023-11-20 人工智能

768阅读

AI视野：奥特曼重回OpenAI；魔搭社区推出开源版GPTS；谷歌Bard遭遇提示注入攻击；Meta重组并解散AI监管团队

???AI新鲜事反转!奥特曼重回OpenAI 据报道，OpenAI 前 CEO Sam Altman与前总裁Greg Brockman在 OpenAI 旧金山总部与公司高管会面。微软和其他投资人正在努力恢复Sam Altman的职位。 Emmett...

大数据 2023-11-20 人工智能

957阅读

【AI热点技术】ChatGPT开源替代品——LLaMA系列之「羊驼家族」

ChatGPT开源替代品——LLaMA系列之「羊驼家族」 1. Alpaca 2. Vicuna 3. Koala 4. ChatLLaMA 5. FreedomGPT 6. ColossalChat 完整的 ChatGPT 克隆解决方案中...

AIGC 2023-11-20 人工智能

1860阅读

OpenAI安全系统负责人长文梳理：大模型的对抗攻击与防御

随着 ChatGPT 的发布，大型语言模型应用正在加速大范围铺开。OpenAI 的安全系统团队已经投入了大量资源，研究如何在对齐过程中为模型构建默认的安全行为。但是，对抗攻击或 prompt 越狱依然有可能让模型输出我们不期望看到的内容。目前在对抗攻击...

生成式AI 2023-11-20 人工智能

1160阅读

百度文心一言可以接入微信小程序啦！

文心一言（英文名：ERNIE Bot）是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感 ...

AIGC 2023-11-20 人工智能

1323阅读

OpenAI的人事地震在硅谷敲响了警钟，让一些技术人员对AI的未来感到担忧

在过去的几年里，硅谷的许多人把希望和命运都寄托在OpenAI大力普及的GenAI技术上。许多行业专家指出，ChatGPT于去年年底首次亮相，那是一个类似iPhone的时刻，它带来了人们通过书面提示与电脑互动的方式的潜在转变，这种提示可以产生创造性的、...

生成式AI 2023-11-20 人工智能

833阅读

whisper.cpp在Windows VS的编译

Whisper是OpenAI开源的一款语音识别的模型，包含有英语和多国语言的模型，根据实际情况来看，其支持的90多种语言的准确率着实表现惊艳，英文甚至可以做到3%左右的误词率，官方图表显示中文的误词率大约是14%，但是实际使用的情况来看，误词率也是相当低，...

人工智能 2023-11-20 人工智能

1364阅读

谷歌Bard「破防」，用自然语言解开，提示注入引起数据泄漏风险

大型语言模型在生成文本时非常依赖提示词。这种攻击技术对于通过提示词学习模型而言可谓是「以彼之矛，攻己之盾」，是最强长项，同时也是难以防范的软肋。提示词分为系统指令和用户给出的指令，在自然语言中，这两者难以区分。如果用户有意在输入提示词时，模仿系统指令，...

生成式AI 2023-11-20 人工智能

946阅读

GPT-4V在自动驾驶上应用前景如何？面向真实场景的全面测评来了

GPT-4V 的发布让许多计算机视觉（CV）应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。最近，一篇题为《On the Road with GPT-4V (ision : Early Explorations of Visua...

人工智能 2023-11-20 人工智能

811阅读

Altman王者归来！强势要求解散董事会，OpenAI终极宫斗一触即发

从被扫地出门到王者回归，乔布斯用了12年，而Sam Altman，仅仅用了两天。现在，Altman已经以胜利者的姿态重返OpenAI探讨自己的去留问题，并且对董事会提出了新的要求—— 「更换现有的董事会成员，并且得到证明自己并无过错的声明。」简单来说...

大数据 2023-11-20 人工智能

870阅读

GPT-4充当“规划师、审计师”，颠覆性双层文生图表模型

DALL-E3、Midjourney、Stable Diffusion等模型展现出了强大的创造能力，通过文本便能生成素描、朋克、3D、二次元等多种类型的高质量图片，但在生成科学图表（柱状、直方、箱线、树状等）方面却略显不足。这是因为模型在生成图表时会遗漏...

大数据 2023-11-20 人工智能

945阅读

OpenAI 的动荡震撼了硅谷，让一些技术人员对人工智能的未来感到担忧

近年来，硅谷的大部分领域已将希望和财富押注在生成型人工智能技术上，OpenAI 在推广这类技术方面起到了关键作用。许多行业专家将去年晚些时候 ChatGPT 的推出比作 iPhone 的突破性时刻，它可能引领人们通过书面提示与计算机互动的方式发生转变，产生...

生成式AI 2023-11-20 人工智能

1014阅读

复旦、人大等发布大五人格+MBTI测试角色扮演AI特质还原率达82.8%

近期，由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性，特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测...

AIGC 2023-11-20 人工智能

894阅读

训练AI助理实现SumTo100游戏自学习与结果预测

译者 | 朱先忠审校 | 重楼简介在一款完美的信息类游戏中，如果你所需要的一切都能够让每一个玩家在游戏规则中看到，这不是一件很神奇的事情吗？但遗憾的是，对于像我这样的普通玩家来说，阅读有关一款新游戏的玩法规则只是学习玩复杂游戏旅程中的一小部分，而...

生成式AI 2023-11-20 人工智能

800阅读

百度文心一言怎么样？

文心一言在3月16号发布，刚发布时只有邀请码体验，没有申请体验通道。到了晚上看到申请体验通道，便提交了申请，到4月1号过了半个月终于收到短信可以体验了。本来想看看接口，也没什么恶意，但是却遭到了拒绝，感觉是小心翼翼，生怕泄露了什么。另外...

AIGC 2023-11-20 人工智能

1006阅读

GitHub Copilot使用指南

GitHub Copilot 是由 GitHub 开发的 AI 编程插件，GitHub Copilot 由 OpenAI Codex 提供支持，OpenAI Codex 是一种由 OpenAI 创建的生成式预训练语言模型，可根据评论和代码的上下文提供上下文...

人工智能 2023-11-20 人工智能

1718阅读

文心一言能成为中国版的ChatGPT吗？

第一个背景环境 2022年11月底，有这样一件事诞生了——人工智能聊天机器人ChatGPT，使其迅速在社交媒体上走红，短短五天之内，注册用户数就超过100万。 ChatGPT（全称：ChatGenerative Pre-trained Transfor...

人工智能 2023-11-19 人工智能

867阅读

BeautifulPrompt：PAI 推出自研 Prompt 美化器，赋能 AIGC一键出美图

背景 Stable Diffusion（SD）是一种流行的AI生成内容（AI Generated Content，AIGC）模型，能在文字输入的基础上生成各种风格多样的图像。在目前的AIGC方向，SD是开源社区最热门的模型。然而，SD能够生成高颜值的图像...

大数据 2023-11-19 人工智能

823阅读

大模型幻觉成应用落地难题最新评测文心一言解决幻觉能力最好

大模型中的幻觉问题 “林黛玉倒拔垂杨柳”、“月球上面有桂树”、“宋江字武松”……相信经常使用大语言模型都会遇到这样“一本正经胡说八道”的情况。这其实是大模型的“幻觉”问题，是大模型行业落地的核心挑战之一。例如幻觉会影响生成内容的可靠性，对于法律、金融、...

AIGC 2023-11-19 人工智能

860阅读

AIGC提示(prompt)工程之开宗明义篇

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...

生成式AI 2023-11-19 人工智能

725阅读

AIGC：【LLM（一）】——LoRA微调加速技术

文章目录一.微调方法 1.1 Instruct微调 1.2 LoRA微调二.LoRA原理三.LoRA使用一.微调方法 Instruct微调和LoRA微调是两种不同的技术。 1.1 Instruct微调 Instr...

AIGC 2023-11-19 人工智能

1686阅读

AI绘画逆着玩火了，敢不敢发自拍看AI如何用文字形容你？

梦晨发自凹非寺量子位 | 公众号 QbitAI 笑不活了家人们，最近突然流行起一个新玩法：给AI发自拍，看AI如何描述你。比如这位勇敢晒出自拍的纽约大学助理教授，他的笑容在AI看来居然是“兽人式微笑”。 AI还吐槽他胡子...

AIGC 2023-11-19 人工智能

875阅读

本地部署开源大模型的完整教程：LangChain + Streamlit+ Llama

在过去的几个月里，大型语言模型(llm 获得了极大的关注，这些模型创造了令人兴奋的前景，特别是对于从事聊天机器人、个人助理和内容创作的开发人员。大型语言模型(llm 是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使...

生成式AI 2023-11-18 人工智能

1291阅读

探寻人工智能前沿迎接AIGC时代——CSIG企业行（附一些好玩的创新点）

上周我有幸参加了由中国图像图形学会和合合信息共同举办的CSIG企业行活动。这次活动邀请了多位来自图像描述与视觉问答、图文公式识别、自然语言处理、生成式视觉等领域的学者，他们分享了各自的研究成果和经验，并与现场观众进行了深入的交流和探讨。干货多多...

大数据 2023-11-18 人工智能

868阅读

stable diffusion实践操作-常见lora模型介绍

系列文章目录本文专门开一节写Lora相关的内容，在看之前，可以同步关注：stable diffusion实践操作文章目录系列文章目录前言一、什么是lora? 1.1 lora 定义 1.2 lora的基本原理 1.2 通...

大数据 2023-11-18 人工智能

2681阅读

重磅！清华最新报告：文心一言超越ChatGPT 3.5

点击下方卡片，关注“CVer”公众号 AI/CV重磅干货，第一时间送达今年国内厂商已发布很多大语言模型，其中最具代表性的产品有：百度的文心一言、阿里巴巴的通义千问、科大讯飞的星火等，最具代表性的开源工作有：ChatGLM、MOSS、Ba...

AIGC 2023-11-18 人工智能

1284阅读

使用 GitHub Copilot 进行 Prompt Engineering 的初学者指南（译）

文章目录什么是 GitHub Copilot ? GitHub Copilot 可以自己编码吗？ GitHub Copilot 的底层是如何工作的？什么是 prompt engineering? 这是 prompt engineering...

大数据 2023-11-18 人工智能

1314阅读

【文心一言】广告文案、演讲稿与请假条自动生成

前言作为一名大学生而言，平时参加或者举办一些学校组织的活动的时候，总是避免不了需要准备一些演讲稿、广告宣传文案等内容，甚至于在疫情十分严重的这几年内，如何跟老师“委婉的”请假，也成为了我日常头疼的事情。但在百度推出文心一言以后，我发现这些事情反...

大数据 2023-11-18 人工智能

1114阅读

GPT、Llama等大模型存在「逆转诅咒」，这个bug该如何缓解？

来自中国人民大学的研究者将 Llama 等因果语言模型所遭遇的 “逆转诅咒” 归咎于 next-token prediction + causal language model 的本质缺陷，并发现 GLM 采用的自回归填空的训练方法对这种 “逆转诅咒”...

人工智能 2023-11-18 人工智能

916阅读

微软面向 Canary 频道 Windows Terminal 用户，开放 AI 聊天体验

11 月 18 日消息，微软宣布面向开源社区，开放 Windows Terminal AI 体验。开发人员可以免费试用 AI 提供的诸多新功能，并可以向微软提交反馈以改善该体验。微软目前已经在 Canary 频道的 Windows Termina...

生成式AI 2023-11-18 人工智能

731阅读

OpenAI爆发人事地震 CEO萨姆·奥特曼被董事会罢免

全球知名的人工智能公司OpenAI最近发生了领导层人事地震。11月17日，OpenAI在官网发布新闻稿宣布，由于公司董事会对现任CEO萨姆·奥特曼的领导能力失去信心，决定将其罢免，首席技术官米拉·穆拉蒂将暂时担任CEO一职。据悉，OpenAI董事会经过...

AIGC 2023-11-18 人工智能

785阅读

230页长文，涵盖5大科学领域，微软团队使用GPT-4探索LLM对科学发现的影响

前不久，微软 DeepSpeed 团队启动了一个名为 DeepSpeed4Science 的新计划，旨在通过 AI 系统优化技术实现科学发现。 11 月 13 日，微软团队在 arXiv 预印平台发表题为《大型语言模型对科学发现的影响：使用 GPT-4...

AIGC 2023-11-18 人工智能

837阅读

如何使用 GitHub Copilot：提示、技巧和用例

生成式人工智能编码工具正在改变开发人员处理日常编码任务的方式。从记录我们的代码库到生成单元测试，这些工具有助于加快我们的工作流程。然而，就像任何新兴技术一样，总是有一个学习曲线。因此，当人工智能驱动的编码助手无法生成他们想要的输出时，开发人员（无论是初学者...

大数据 2023-11-18 人工智能

1204阅读

基于文档的智能问答系统

基于文档的问答系统（Document-Based Question Answering System）是一种自然语言处理技术，用于回答用户提出的问题。它的原理是通过分析文档中的内容，提取出与用户问题相关的信息，并将其转换成可回答问题的格式。 ChatGP...

人工智能 2023-11-18 人工智能

833阅读

文心一言内测体验

文心一言申请内测弱智吧经典问题陨石为什么每次都能精准砸到陨石坑？我想配个6000多的电脑，大概要多少钱？为什么我爸妈结婚的时候没邀请我参加婚礼？我买了一斤藕，为什么半斤都是空的？我应该怎么称呼女朋友的老公写一篇报告，关于：吃蔬...

AIGC 2023-11-18 人工智能

791阅读

chatgpt平替，清华chatglm本地化部署教程（aigc大模型风口，校招找工作必备），包含weiui部署，api部署，对话框部署

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。...

AIGC 2023-11-18 人工智能

1272阅读

OpenAI 新发布GPT 最佳实践；WordPress新增 AI写作助手；国产语言模型TigerBot发布

? AI新闻 ? WordPress新增Jetpack AI Assistant AI写作助手摘要：Automattic公司宣布，为其WordPress新增AI写作助手–Jetpack AI Assistant。该工具可根据用户提示撰写博文、详情...

生成式AI 2023-11-18 人工智能

1017阅读

解决LLaMA、BERT等部署难题：首个4-bit浮点量化LLM来了

大语言模型 (LLM 压缩一直备受关注，后训练量化（Post-training Quantization 是其中一种常用算法，但是现有 PTQ 方法大多数都是 integer 量化，且当比特数低于 8 时，量化后模型的准确率会下降非常多。想较于 In...

生成式AI 2023-11-17 人工智能

833阅读

AI视野：ChatGPT测试新功能“从聊天中学习”；Kimi Chat全面开放服务；文心生物计算大模型宣布升级；Meta发布AI视频编辑工具Emu Video；贾跃亭也开始搞AI了

???AI新鲜事 ChatGPT测试新功能“从聊天中学习” ChatGPT测试新功能，能学习用户历史聊天、理解偏好，还支持重置记忆和阅后即焚功能，使其更像个性化的朋友。【AiBase提要:】 ? 学习历史聊天: ChatGPT将能够在一个新的“My C...

AIGC 2023-11-17 人工智能

1200阅读

使用代码下载开源的大模型文件示例以及中文微调llama资源汇总：

一、下载示例 from huggingface_hub import snapshot_download repo_id = "THUDM/chatglm2-6b" local_dir = './chatglm2-6b/' cache_dir = l...

大数据 2023-11-17 人工智能

1238阅读

GPT-4 Turbo问世，API更划算，128K上下文窗口引领新时代

一、简介在发布GPT-4（点击了解GPT-4）仅仅八个月后，OpenAI推出了更新的模型GPT-4 Turbo，该模型具有可以在一次提示中容纳300页书的上下文窗口，并且提供更便宜的API访问。【GPT-4 Turbo】：https://openai...

AIGC 2023-11-17 人工智能

1110阅读