语言模型第55页

文心一言和chatgpt

目录百度文心一言新一代大语言模型、生成式 AI 产品文心一言，能做什么？脚踏实地，仰望星空...

生成式AI 2023-11-27 人工智能

736阅读

LLMs之Code：大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等)及其评估

LLMs之Code：大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等及其评估基准(包括数据集、案例应用之详细攻略目录大模...

AIGC 2023-11-27 人工智能

822阅读

大模型的实践应用6-百度文心一言的基础模型ERNIE的详细介绍，与BERT模型的比较说明

大家好，我是微学AI，今天给大家讲一下大模型的实践应用6-百度文心一言的基础模型ERNIE的详细介绍，与BERT模型的比较说明。在大规模语料库上预先训练的BERT等神经语言表示模型可以很好地从纯文本中捕获丰富的语义模式，并通过微调的方式一致地提高各种NLP...

生成式AI 2023-11-27 人工智能

934阅读

AI生成内容（AIGC）：概念、实现与未来趋势

一、AIGC的基本概念 AI生成内容（AIGC），是指运用人工智能技术，尤其是深度学习技术，创建各类数字内容的新型内容创作模式。AIGC继承了专业生成内容（PGC）的高质量特点，再结合用户生成内容（UGC）的分布式、互动的特点，打造了全新的数字内容生成与...

人工智能 2023-11-27 人工智能

1234阅读

文心一言和讯飞星火全面对比测试：（一）语言理解能力

目录 01 前言 02 测试内容设计 03 复杂语义测试 04 文章的情绪识别 05 文章的摘要总结 06 文章要素提取 07 总结 01 前言文心一言和讯飞星火是目前国内开展正式公测的两个大语言模型。很多公司...

AIGC 2023-11-26 人工智能

1302阅读

微软的人工智能 Copilot 到底有多强大？带你来体验一下

本文同步发表于我的微信公众号，扫一扫文章底部的二维码或在微信搜索郭霖即可关注，每个工作日都有文章更新。说实话，这是一篇我早就应该写的文章，我也不知道为什么我能拖这么久。但好像从来也没有读者朋友们催我写过这类文章，这为我的拖更提供了很好的理由...

大数据 2023-11-26 人工智能

1004阅读

一文读懂 AutoGPT 开源 AI Agents

Hello folks，我是 Luga，今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - AutoGPT AI Agents ，本文将聚焦在针对不同类型的 AutoGPT 技术进行解析，使得大家能够了解不同 AutoGPT 实现机制以及所应...

人工智能 2023-11-26 人工智能

1081阅读

自驱力超强的羊驼？斯坦福微调LLaMa

大型“指令调优”语言模型在新任务上展现了Zero-shot的卓越能力，但严重依赖于人类编写的指令数据，而这些数据在数量、多样性和创造性方面都是有限的。斯坦福科研人员引入了self-instruction框架，提高指令遵循能力来自我迭代进化，与Instr...

大数据 2023-11-26 人工智能

928阅读

比「让我们一步一步思考」这句咒语还管用，提示工程正在被改进

大型语言模型（LLM）已经是许多自然语言处理任务的强大工具，只要能给出正确的提示。然而，由于模型的敏感性，找到最优提示通常需要进行大量手动尝试和试错努力。此外，一旦将初始提示部署到生产环境中，可能会出现意想不到的边缘情况，需要更多轮的手动调整来进一步完善...

生成式AI 2023-11-26 人工智能

871阅读

与AIGC的快乐游戏: Prompt提示词的重要性

你好，亲爱的读者们！我是你们的老朋友小W，致力于探索和分享一切有关人工智能的话题。今天，我想带你走进一个全新的领域——玩转AIGC（Artificial Intelligence Generated Content），并告诉你一个重要的秘密：Prompt提...

大数据 2023-11-26 人工智能

843阅读

每日学术速递1.30

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理更多Ai资讯：今天带来的arXiv上最新发表的3篇文本图像的生成论文。 Subjects: cs.LG、cs.Cv、cs.AI、c...

生成式AI 2023-11-26 人工智能

854阅读

为什么微软必须拯救OpenAI

雇佣 CEO，雇佣团队，派遣 CEO 回去，坐上董事会——微软将不惜一切代价让 OpenAI 保持运行。译自Why Microsoft Has to Save OpenAI。生成式AI明星公司OpenAI的混乱瓦解，就像一个提前的感恩节家庭争吵，起初...

AIGC 2023-11-26 人工智能

897阅读

三分钟快速构建大语言模型AI知识库

FastGPT FastGPT 是一个基于 LLM 大语言模型的知识库问答系统，提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排，从而实现复杂的问答场景！知识库核心流程图图片图片来源：https://doc.fa...

大数据 2023-11-26 人工智能

1203阅读

【类ChatGPT】中文LLaMA-2、Alpaca-2 二代羊驼大模型体验

前言 Meta发布的一代LLaMA已经掀起了一股开源大模型热潮，也有很多相关工作不断涌现。最近Meta全新发布了Llama-2，效果更上一层楼。而且最重要的是模型可以相对随意分发了，不像一代一样，meta不让开发者发布基于llama模型训...

大数据 2023-11-26 人工智能

1033阅读

Llama2通过llama.cpp模型量化 Windows&Linux本地部署

Llama2通过llama.cpp模型量化 Windows&Linux本地部署什么是LLaMA 1 and 2 LLaMA，它是一组基础语言模型，参数范围从7B到65B。在数万亿的tokens上训练的模型，并表明可以专门使用公开可用的数据...

生成式AI 2023-11-25 人工智能

1428阅读

大模型之Bloom&LLAMA----Pre-Training(二次预训练)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

生成式AI 2023-11-25 人工智能

1075阅读

2 天：我用文字 AI-ChatGPT 写了绘画 AI-Stable Diffusion 跨平台绘画应用

文本 AI - ChatGPT 和绘画 AI - Stable Diffusion，平地惊雷，突然进入寻常百姓家。如果时间可以快进，未来的人们对于我们这段时光的历史评价，大概会说：当时的人们在短时间连续经历了这几种情感。从不信，去试试看；到远超预期...

生成式AI 2023-11-25 人工智能

1004阅读

Chatbot开发三剑客：LLAMA、LangChain和Python

聊天机器人（Chatbot）开发是一项充满挑战的复杂任务，需要综合运用多种技术和工具。在这一领域中，LLAMA、LangChain和Python的联合形成了一个强大的组合，为Chatbot的设计和实现提供了卓越支持。首先，LLAMA是一款强大的自然语...

大数据 2023-11-25 人工智能

934阅读

OpenAI神秘Q毁灭人类？爆火「Q假说」竟牵出世界模型，全网AI大佬长文热议

Q* 【新智元导读】传闻中OpenAI的Q*，已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文，猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI，已是临门一脚了? Ope...

人工智能 2023-11-25 人工智能

835阅读

被“薄纱”的文心一言，真的一无是处？

大家好，我是王有志，欢迎和我聊技术，聊漂泊在外的生活。本文单纯讨论文心一言，不涉及其母公司百度的所作所为 3月16日百度交卷了，正式推出了自己的知识增强大语言模型文心一言。作为全球第二家，中国第一家正式推出的大语言模型，文心一言被很多人寄予厚望，期...

大数据 2023-11-25 人工智能

1035阅读

谷歌推出免费AI编程神器Colab，欲将Copilot拉下神坛

在如今的AI编码工具领域，微软旗下的Github Copilot可以算得上是一家独大，而作为老对手的谷歌显然并不愿屈服于此。近日，谷歌通过其官网高调发文宣布，将为研发工具Google Colaboratory（Colab）加入全新的AI编码功能，包括...

AIGC 2023-11-25 人工智能

1422阅读

ChatGPT、Google Bard、Claude2、新BING哪一款人工智能聊天机器人适合自己

人工智能聊天机器人正在提高数无数专业人士的工作效率。下面我们就来看看目前最流行的几款强大的人工智能工具，以及它们具体如何帮助到你。今年7月AI圈最大的动静之一便是AI初创公司Anthropic发布了其AI聊天机器人Claude最新版本——Claud...

生成式AI 2023-11-25 人工智能

944阅读

【网安AIGC专题11.1】11 Coreset-C 主动学习：特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)

Active Code Learning: Benchmarking Sample-Efficient Training of Code Models 写在最前面论文名片先验知识的补充主动学习采样函数 benchmark基准和base...

大数据 2023-11-25 人工智能

1013阅读

Meta AI研究团队新AI模型： Llama 2 大语言模型

Llama是Facebook Research团队开发的基础语言模型集，旨在提供广泛的语言理解能力。它基于转换器架构，参数范围从7B到65B。通过使用Llama模型，研究人员和开发人员可以构建更先进的自然语言处理系统。您可以在GitHub上找到相关的代...

人工智能 2023-11-25 人工智能

955阅读

AIGC数据处理与存储解决方案

针对在AIGC的场景下，如何解决在AIGC训练过程中数据的存储和数据处理的问题，杨冠军从三个方面进行介绍与解读：一是AIGC对存储提的新需求；二是介绍腾讯云可以给用户提供的整体存储解决方案； ...

大数据 2023-11-25 人工智能

1008阅读

数字人系列四：Motionverse 接入chatgpt、文心一言等国内外大语言模型

1. 下载插件：motionverse官网地址：概述 · Motionverse 接口文档 (deepscience.cn 2. 按照官方文档新建Unity工程：对接说明 · Motionverse 接口文档 (deepscience.cn ...

AIGC 2023-11-25 人工智能

985阅读

通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测

引言 “克隆 dev 环境到 test 环境，等所有服务运行正常之后，把访问地址告诉我”，“检查所有项目，告诉我有哪些服务不正常，给出异常原因和修复建议”，在过去的工程师生涯中，也曾幻想过能够通过这样的自然语言指令来完成运维任务，如今 AI 助手 Ap...

大数据 2023-11-25 人工智能

1242阅读

使用QLoRA对Llama 2进行微调的详细笔记

使用QLoRA对Llama 2进行微调是我们常用的一个方法，但是在微调时会遇到各种各样的问题，所以在本文中，将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的，大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。导入库...

生成式AI 2023-11-25 人工智能

805阅读

【Rust日报】2023-03-14 Rust实现的纯 CPU 运算的 LLaMA 模型

Rust实现的纯 CPU 运算的 LLaMA 模型我试图让 LLaMA 语言模型在纯 CPU实现上工作，灵感来自于这里的一个很棒的CPU实现：https://github.com/ggerganov/ggml，它可以运行GPT-J 6B模型。...

AIGC 2023-11-25 人工智能

883阅读

【多模态】4、Chinese CLIP | 专为中文图文匹配设计

文章目录一、背景二、方法 2.1 基础内容 2.2 数据集 2.3 预训练方法 2.4 模型尺寸三、效果四、代码 4.1 推理论文：Chinese CLIP: Contrastive Vision-Language Pr...

人工智能 2023-11-24 人工智能

2495阅读

AI视野：ElevenLabs发布“语音转语音”；realme GT5Pro 12月7日发布；Claude2.1被指严重虚标；清华大学提出全新加速训练大模型方法SoT

???AI应用 ElevenLabs发布“语音转语音” ElevenLabs的语音生成式AI平台发布了“语音转语音”功能，用户可上传语音并自动转换为不同音色，实现声音的自由切换，为用户带来全新的语音生成体验。免费体验地址:https://elevenl...

AIGC 2023-11-24 人工智能

1045阅读

LLaMA-2论文阅读

1. 基本介绍 LLaMA-2是2023年7月24日Meta发布的LLaMA第二代，跟LLaMA-1几个显著区别: 免费可商用版本的大模型 context上下文增加了一倍，从2K变为了4K 训练的总token数从1.0T/1.4T增加为2.0T(...

生成式AI 2023-11-24 人工智能

1174阅读

LeCun发文质疑LLM推理能力大模型涌现离不开上下文学习

近期，LeCun在推特上引发了关于大语言模型（LLM）推理能力的讨论，强调LLM缺乏真正的规划推理能力，其涌现能力实际上是上下文学习的结果。研究通过多个实验验证LLM在复杂规划任务上表现不佳，强调其能力受限于任务复杂度。研究团队在GPT-4上进行的实验显...

大数据 2023-11-24 人工智能

887阅读

由文心一言发布会引发的思考，聊聊我未来的学习规划

文章目录前言一. 文心一言的试用 1.1 文心一言发布会 1.2 文心一言图片生成功能试用 1.3 文心一言文本功能试用 1.4 文心一言代码功能试用 1.5 试用总结二. 我未来的学习规划 2.1 向csdn的大佬请教 2.2 关...

大数据 2023-11-24 人工智能

844阅读

数字化转型和AI创新驱动银行业进入新时代

在一个由技术快速进步和不断演变的监管格局的时代，银行机构保持竞争力和合规的必要性从未像现在这样迫切，这在很大程度上是由当前的经济下行和不断上升的运营成本推动的，这些因素给银行带来了新的压力。为了应对这些挑战，过去几年，银行业在两个领域实现了指数式增长...

大数据 2023-11-24 人工智能

848阅读

视频生成新突破：PixelDance，轻松呈现复杂动作与炫酷特效

最近，除了大语言模型继续持续刷屏，视频生成技术也取得了重大进展，多家公司相继发布了新模型。首先，作为最早探索视频生成领域的领头羊之一，Runway 升级了其 Gen-2 模型，带来了电影级别的高清晰度，令人瞩目，并称视频生成的一致性得到了重大改进。但...

生成式AI 2023-11-24 人工智能

976阅读

Hugging Face最受欢迎15大AI机构出炉！清华第五，OpenAI第十，冠军竟是它？

【新智元导读】Hugging Face作为开源AI社区的代表，总结了社区最欢迎的前15个公司和机构。让我们看看在开源社区眼里，哪些机构对于开源AI贡献最大。 Hugging Face上最受欢迎的15个AI公司出炉了! 目前的冠军，是Stability AI...

生成式AI 2023-11-24 人工智能

921阅读

ChatDev官方下载地址 AI聊天机器人创建工具推荐

ChatDev软件开发平台是一款基于大型语言模型（LLM）的创新软件开发工具，可以通过自然语言交流来统一和简化软件开发的关键过程，也可以用于开发AI聊天机器人。那么ChatDev在哪里可以体验呢?这里就给大家带来ChatDev官网体验入口。 >&g...

AIGC 2023-11-24 人工智能

1614阅读

AI加速“科技权势”集中，巨头垄断AI会造成严重后果吗？

大家有没有发现，AI技术似乎相当集中，科技巨头占尽优势。基于这一现实，许多科技高管纷纷发声预警，他们认为：科技巨头本来已经拥有相当大的权势，到了AI时代权势将会更大。去年OpenAI推出ChatGPT，它可以根据提示给出答案，瞬间引爆了生成式AI大变革...

AIGC 2023-11-24 人工智能

856阅读

AI风暴：文心一言 VS GPT-4

?wei_shuo的个人主页 ?wei_shuo的学习社区 ?Hello World ！文心一言 VS GPT-4 文心一言：知识增强大语言模型百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动，回答问...

大数据 2023-11-24 人工智能

866阅读

“大模型本质就是两个文件！”特斯拉前AI总监爆火LLM科普，时长1小时，面向普通大众

特斯拉前AI总监Andrej Karpathy的新教程火了。这次，他专门面向普通大众做了一个关于大语言模型的科普视频。时长1小时，全部为“非技术介绍”，涵盖模型推理、训练、微调和新兴大模型操作系统以及安全挑战，涉及的知识全部截止到本月（非常新）。...

人工智能 2023-11-24 人工智能

811阅读

OpenAI内斗时，Karpathy在录视频：《大型语言模型入门》上线

OpenAI 的风波暂时告一段落，员工也忙着「干活了」。年初回归 OpenAI 的 Andrej Karpathy 最近做了一场关于大型语言模型（LLM）的 30 分钟入门讲座，但该讲座当时没录制。因此，他基于这场讲座重新录制了一个长达 1 小时的视频...

生成式AI 2023-11-24 人工智能

813阅读

这项AI研究引入 Atom：一种低位量化技术，可实现高效、准确LLM)服务

大型语言模型（LLM）是人工智能领域最新的引入，已经席卷全球。这些模型以其令人难以置信的能力，被人们广泛使用，无论是研究人员、科学家还是学生。凭借其仿人潜力回答问题、生成内容、概括文本、完成代码等方面，这些模型已经走过了很长的路程。 LLM 在情感分析、智...

人工智能 2023-11-24 人工智能

891阅读

牛津大学AI研究员发出警告:大语言模型对科学真相构成风险

在最新的一篇研究中，牛津大学互联网研究所的人工智能研究员发出了对大语言模型（LLMs）对科学真相构成威胁的警告。由Brent Mittelstadt、Chris Russell和Sandra Wachter等研究员在《自然人类行为》期刊上发表的论文中，他们...

人工智能 2023-11-24 人工智能

825阅读

清华大学提出全新加速训练大模型方法SoT

近日，微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought（SoT）”的全新人工智能方法，旨在解决大型语言模型(LLMs 生成速度较慢的问题。尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响，但其处理速度的...

大数据 2023-11-24 人工智能

812阅读

【GPT4】微软 GPT-4 测试报告（3）GPT4 的编程能力

欢迎关注【youcans的GPT学习笔记】原创作品，火热更新中微软 GPT-4 测试报告（1）总体介绍微软 GPT-4 测试报告（2）多模态与跨学科能力微软 GPT-4 测试报告（3）GPT4 的编程能力【GPT4】微软 GPT-4 测试...

生成式AI 2023-11-24 人工智能

1047阅读

淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA

9月12日，淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA，旨在让技术开发者们能够更方便地提升大语言模型训练性能，降低训练成本，并保持和LLaMA社区的兼容性。测试显示，在32卡训练上，相比HuggingFace上直接获得的...

生成式AI 2023-11-24 人工智能

930阅读

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation

LLMs之LLaMA-2：源码解读之所有py文件(包括example_text_completion.py/example_chat_completion.py+model.py/generation.py/tokenizer.py 目录一、l...

AIGC 2023-11-24 人工智能

810阅读

AI 绘画Stable Diffusion 研究（十七）SD lora 详解（上）

大家好，我是风雨无阻。本期内容： Lora的原理是什么？ Lora如何下载安装？ Lora如何使用？大家还记得 AI 绘画Stable Diffusion 研究（三）sd模型种类介绍及安装使用详解这篇文章中，曾简单介绍了Lora的安装和使用吗？...

生成式AI 2023-11-24 人工智能

1195阅读

2023年微软开源八个人工智能项目

作者 | Tsamia Ansari 策划 | 言征自2001年软件巨头微软前首席执行官史蒂夫·鲍尔默对开源（尤其是Linux）发表尖刻言论以来，微软正在开源方面取得了长足的进步。继ChatGPT于去年年底发布了后，微软的整个2023年，大多数技术...

人工智能 2023-11-24 人工智能

943阅读