语言模型第15页

【AIGC调研系列】llama 3与GPT4相比的优劣点

Llama 3与GPT-4相比，各有其优劣点。以下是基于我搜索到的资料的详细分析： Llama 3的优点：更大的数据集和参数规模：Llama 3基于超过15T token的训练，这相当于Llama 2数据集的7倍还多[1][3]。此外，它拥有40...

AIGC 2024-05-31 人工智能

1209阅读

LLMs之RAG：只需四步骤—基于Ollama后端框架(配置phi3/LLaMA-3模型)结合Dify前端框架(设置知识库文件+向量化存储+应用发布)创建包括实现本地知识库问答/翻译助手等多个应用

LLMs之RAG：基于Ollama后端框架(配置phi3/LLaMA-3模型结合Dify前端框架(设置知识库文件+向量化存储+应用发布创建包括实现本地知识库问答/翻译助手等多个应用目录基于Ollama后端框架(配置phi3/LLaMA-...

大数据 2024-05-31 人工智能

1210阅读

Opera浏览器宣布接入端侧AI大模型

5月29日，昆仑万维旗下海外信息分发与元宇宙平台Opera宣布，其旗舰浏览器Opera One以及游戏浏览器Opera GX将正式接入端侧AI大模型，成为全球第一个接入端侧AI大模型的主流浏览器。据悉，2024年4月，Opera已通过AI Featur...

大数据 2024-05-31 人工智能

783阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMA 3

LLaMA 3 2024年4月18日，Meta 重磅推出了Meta Llama 3，Llama 3是Meta最先进开源大型语言模型的下一代，包括具有80亿和700亿参数的预训练和指令微调的语言模型，能够支持广泛的应用场景。这一代Llama在一系列行业标...

AIGC 2024-05-31 人工智能

1599阅读

用自然语言来编程GitHub Copilot；提高代码质量开源工具GPTLint；LLMs开源医学Meditron

✨ 1: GitHub Copilot Workspace 以Copilot 为中心的创新开发者环境，让开发者能用自然语言从构思到编码再到软件开发。 GitHub Copilot Workspace是一个以Copilot为中心的开发者环境，...

AIGC 2024-05-30 人工智能

942阅读

生成式AI开启大航海时代，但不能靠一个模型走天下

你看过泰勒·斯威夫特用流利的中文与粉丝互动吗?你用过“史上最丑”的黏土特效吗?你听过“肯德基疯狂星期四”主题的交响音乐吗? 生成式AI正在重新定义商业规则。仅2024年3月，就有三家由华人创立的AI视频生成初创企业成功获得千万美元级别的融资:位于英国伦敦...

生成式AI 2024-05-30 人工智能

863阅读

被追捧的AI Agent，如何避开落地应用的这些坑？

从OpenAI推出系列GPTs，到国内众多大厂和初创企业从应用层、平台层、开发层、运营层等多个方向布局Agent，必须承认，Agent正在以异乎寻常的势头发展，也呈现出百花齐放的产品形态。 “agent”，中文意思是代理人。以此类推，所谓AI agent...

大数据 2024-05-30 人工智能

946阅读

OpenAI与《大西洋月刊》和The Verge发行商Vox Media达成合作

人工智能公司 OpenAI 近日宣布与美国杂志《大西洋月刊》和数字媒体公司 Vox Media 达成合作协议。根据协议，OpenAI 将获得许可使用两家公司的内容，用于训练其大型语言模型（LLMs）和多媒体 AI 模型(如 GPT-4o，Sora 。图...

生成式AI 2024-05-30 人工智能

825阅读

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

大型语言模型(llm 是在巨大的文本语料库上训练的，在那里他们获得了大量的事实知识。这些知识嵌入到它们的参数中，然后可以在需要时使用。这些模型的知识在培训结束时被“具体化”。在预训练结束时，模型实际上停止学习。对模型进行对齐或进行指令调优，让模型学习...

人工智能 2024-05-30 人工智能

819阅读

LLMs之LLaMA-3：Llama-3-70B-Gradient-1048k-adapter的简介、源代码解读merge_adapters.py(仅需58行代码)合并多个PEFT模型(LoRA技术)

LLMs之LLaMA-3：Llama-3-70B-Gradient-1048k-adapter的简介、源代码解读merge_adapters.py(仅需58行代码合并多个PEFT模型(LoRA技术将LLaMA-3扩展到100万/1048k上下文——解析...

AIGC 2024-05-30 人工智能

1235阅读

AIGC从入门到实战：ChatGPT 日均算力运营成本的推算

1. 背景介绍 1.1 AIGC的兴起与ChatGPT的突破近年来，人工智能生成内容（AIGC）技术取得了显著进展，其中以ChatGPT为代表的大型语言模型（LLM）展现出强大的内容生成能力，在对话系统、文本创作、代码生成等领域取得了突破性成果，掀起...

人工智能 2024-05-30 人工智能

1128阅读

五一假期Llama 3之魔改不完全攻略（Part 2)

2024年4月18日，Meta AI 正式宣布推出 Llama 3，这标志着开源大型语言模型（LLM）领域的又一重大进步。如同一颗重磅炸弹， Llama 3 以其卓越的性能和广泛的应用前景，预示着 AI 技术的新时代。目前开源的是Llama3 8B 和...

生成式AI 2024-05-30 人工智能

885阅读

黑客发布破解版ChatGPT “Godmode GPT”

黑客发布了一款名为 "GODMODE GPT" 的破解版 ChatGPT。今天早些时候，一位自称为 "Pliny the Prompter" 的白帽黑客和 AI 红队成员在 X-formerly-Twitter 上宣布了这款 ChatGPT 的破解版本的发...

AIGC 2024-05-30 人工智能

1015阅读

什么是通用人工智能？你知道吗？

图片图片图片图片图片图片窄人工智能，对应英文Artificial Narrow Intelligence，简称ANI，也被称为特定任务人工智能。顾名思义，窄人工智能用于完成某一项或几项特定的任务，比如智能驾驶、人脸识别、AlphaGo、AI...

AIGC 2024-05-30 人工智能

952阅读

AlphaFold 3不开源，统一生物语言大模型阿里云先开了！

把169861个生物物种数据装进大模型，大模型竟get到了生物中心法则的奥秘—— 不仅能识别DNA、RNA与相应蛋白质之间的内在联系，在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中也能比肩SOTA模型。模型名为LucaOne，由阿里云...

人工智能 2024-05-30 人工智能

914阅读

超详细！AIGC面试系列大模型进阶(2)

本期问题快览 1. 如何让大模型处理更长的文本？ 2. 如果想要在某个模型基础上做全参数微调，究竟需要多少显存？ 3. 什么是有监督微调SFT 4. SFT 指令微调数据如何构建? 5. 领域数据训练后，通用能力往往会有所下降，如何缓解模型遗忘...

人工智能 2024-05-30 人工智能

1771阅读

百度文心一言：官方开放API开发基础

目录一、模型介绍 1.1主要预置模型介绍 1.2 计费单价二、前置条件 2.1 创建应用获取 Access Key 与 Secret Key 2.2 设置Access Key 与 Secret Key 三、基于千帆SDK开发 3.1 M...

大数据 2024-05-30 人工智能

1401阅读

Google Bard的Gemini Pro最新升级；Nomic Embed: 开源文本嵌入模型

? AI新闻 ? Google Bard的Gemini Pro最新升级摘要：Bard现在可以在超过40种语言和230多个国家和地区使用Gemini Pro，提供更强大的理解、推理、总结和编码能力。 Bard的双重检查功能将扩展到40多种语言，用户...

生成式AI 2024-05-29 人工智能

1005阅读

数据驱动与 LLM 微调：打造 E2E 任务型对话 Agent

作者 | Thought Agent 社区在对话系统的设计和实现中，传统的基于 Rasa-like 框架的方法往往需要依赖于多个模块的紧密协作，例如我们在之前的文章中提到的基于大模型（LLM）构建的任务型对话 Agent，Thought Agent，其...

生成式AI 2024-05-29 人工智能

1213阅读

Meta AI的首席执行官LeCun：不要从事LLM工作

出品 | 51CTO技术栈（微信号：blog51cto）在巴黎举行的初创企业年度技术大会VivaTech上，Meta AI的首席执行官Yann LeCun建议希望在AI生态系统中工作的学生不要从事LLM（大型语言模型）方面的工作。 “如果你是对构建下一...

AIGC 2024-05-29 人工智能

853阅读

研究发现：OpenAI 的 GPT-4 在金融分析领域具有 “相对优势”：

根据芝加哥大学布斯商学院的一项研究，OpenAI 的 GPT-4在金融分析和预测方面超越了人类分析师，即使没有行业特定信息。这项研究上周公布，发现 GPT-4这一大型语言模型在分析财务报表和预测未来收益方面表现出色。研究称:“即使没有任何叙述或行业特定信息...

生成式AI 2024-05-29 人工智能

926阅读

当前都在堆长窗口，还需要 RAG 吗？

自从谷歌的 Gemini 1.5 Pro 发布后，行业内就有不少人在背后“蛐蛐” RAG。一方面是因为，Gemini 的表现确实亮眼。根据官方发布的技术报告，Gemini 1.5 Pro 能够稳定处理高达100 token，相当于1小时的视频、11小时...

人工智能 2024-05-29 人工智能

1085阅读

和GPT4等大模型玩狼人杀人类因讲话没深度被3票出局

最近，一位昵称为「Tore Knabe」的网友在X平台发布的一段视频引发了人们的讨论。视频中，四个AI NPC与一个人类坐在一起，按照“乘务员”的要求互相试探，找出其中隐藏的人类。每个NPC都对应着一款大模型，而五位扮演者分别被赋予了一个历史知名人物作为角...

人工智能 2024-05-29 人工智能

922阅读

AGI渐行渐近，该加速还是要踩刹车？

人类距离第一个AGI的出现已经越来越近了！马斯克在今年早些时候预测，AGI可能会在2026年投入使用。DeepMind联合创始人、首席AGI科学家Shane Legg在一次访谈中认为，2028年，人类有50%的概率开发出第一个AGI。然而百度CEO李...

大数据 2024-05-29 人工智能

902阅读

和GPT-4这些大模型玩狼人杀，人类因太蠢被票死，真·反向图灵测试

「你看，人类一败涂地了」这是一次「反向图灵测试」，几个全球最先进的大模型坐在一起，坐着火车唱着歌，但其中混进了人类: 而 AI 的任务，是把这个人类揪出来。最近，一位昵称「Tore Knabe」的网友在 X 平台发布的一段视频引发了人们的讨论。在视频中...

生成式AI 2024-05-29 人工智能

897阅读

一文带你了解大模型：智能体（Agent）

作者 | lucasgftang 大语言模型 vs 人类大语言模型很强大，就像人类的大脑一样拥有思考的能力。如果人类只有大脑，没有四肢，没有工具，是没办法与世界互动的。如果我们能给大模型配备上四肢和工具呢？大模型是不是就会打破次元壁，从数字世界走向现实...

生成式AI 2024-05-29 人工智能

2424阅读

硅谷“鲁迅”开喷！AI大佬LeCun狂怼马斯克、OpenAI

硅谷正经历着一场由人工智能引发的激烈辩论。引领这一风潮的不是别人，正是机器学习之父、图灵奖得主、Meta首席人工智能科学家Yann LeCun。LeCun以其直言不讳的风格，在AI领域掀起了一场舌战风暴，从马斯克到OpenAI，全都被他毫不客气地“怼”了一...

生成式AI 2024-05-29 人工智能

813阅读

硅谷有了自己的鲁迅！AI大佬LeCun连续暴走，从马斯克到OpenAI，全被怼了个遍

当地时间 5 月 26 日，马斯克旗下的人工智能初创公司xAI宣布完成B轮 60 亿美元融资。主要的投资者包括 Valor Equity Partners、Vy Capital、Andreessen Horowitz、红杉资本等。 xAI2023 年 7...

生成式AI 2024-05-29 人工智能

872阅读

华信永道联合智谱AI发布“智道奇点”政务大模型SagesrvGLM

近日，由华信永道（北京）科技股份有限公司与北京智谱华章科技有限公司(智谱AI 联手打造的政务服务人工智能大模型——智道奇点SagesrvGLM，在北京盛大发布。这一创新产品不仅吸引了众多政府官员、企业代表和媒体的眼球，更以其卓越的技术特性和深远的行业影响，...

大数据 2024-05-29 人工智能

833阅读

Meta的 Llama-3 在线使用与下载

前言 2024年4月19日，全球社交巨头Meta在他们的官网，正式发布了开源大模型 Llama-3 ！！该版本包括预训练和指令调整的 Llama 3 语言模型的模型权重和起始代码 - 包括 8B 到 70B 参数！简介 Llama 3 在 2...

大数据 2024-05-29 人工智能

1116阅读

文心一言 vs GPT-4 ----全面横向比较

文心一言 (Wenxin Yiyan 和 GPT-4 是两个强大的人工智能语言模型，它们在处理自然语言方面表现出了出色的能力。但它们有一些关键的区别和优势。以下是它们的横向比较：公司和平台： * 文心一言是由百度开发的中文语言模型，专...

AIGC 2024-05-28 人工智能

1422阅读

在树莓派上运行语音识别和LLama-2 GPT!

目前，绝大多数大模型运行在云端服务器，终端设备通过调用api的方式获得回复。但这种方式有几个缺点：首先，云api要求设备始终在线，这对于部分需要在无互联网接入的情况运行的设备很不友好；其次，云api的调用需要消耗流量费，用户可能不想支付这部分费用；最后，如...

人工智能 2024-05-28 人工智能

1111阅读

不影响输出质量还能追踪溯源，「大模型无偏水印」入选ICLR 2024 Spotlight

本文通讯作者为马里兰大学计算机系的博士生胡正冕，其导师为 Heng Huang。他的主要研究方向是采样与机器学习理论，曾在ICML、NeurIPS、ICLR等顶级会议上发表多篇论文。邮箱: huzhengmian@gmail.com 随着大语言模型（LL...

人工智能 2024-05-28 人工智能

1068阅读

独角兽被微软挖角，新团队首曝光！情感AI嵌入机器人，超大内存升级情感体验

今年 3 月，人工智能领域的领军人物Mustafa Suleyman离开Inflection AI，转而领导微软的人工智能部门。微软在如火如荼的人工智能人才争夺战中获胜的消息在科技界引起热议，但很少有人讨论这次离职对Inflection AI的影响。...

人工智能 2024-05-28 人工智能

866阅读

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注大语言模型的微...

AIGC 2024-05-28 人工智能

919阅读

AIGC学习：（一）langchain介绍

一、LangChain介绍 langChain是用于快速构建AI应用的框架(第三方开源库。这里是官网，这里是Github 源码。 “一句话”介绍：类似于Angular、React、Vue 等快速构建Web应用的前端框架. 类似于ReactNati...

AIGC 2024-05-28 人工智能

1169阅读

OpenAI联创Greg最新采访：为什么OpenAI最先做出GPT-4？

凯文·凯利在《5000天后的世界》一书中预测，称雄AR世界的不会是GAFA——如今的科技四大巨头。纵观颠覆性技术的发展史，一个领域的主导者从来无法在下一个时代的平台上继续称雄，因为它们的成功会成为它们最大的桎梏。事实仿佛真的如此。即便谷歌疯狂自证在A...

大数据 2024-05-28 人工智能

873阅读

GenAI与数据保护：对雇主来说最大的风险是什么？

如果你是雇主，打算试验像ChatGPT这样的GenAI工具，有一些数据保护陷阱需要引起注意。近年来，美国、欧洲和全球范围内的隐私和数据保护立法不断增加，你不能简单地将人力资源数据输入GenAI工具。毕竟，员工数据通常是高度敏感的，包括绩效数据、财务信息...

生成式AI 2024-05-28 人工智能

816阅读

CIO指南：采用开源生成式AI需要注意的十件事

开源生成式AI模型是可以免费下载的、大规模使用而无需增加API调用成本的，并且可以在企业防火墙后面安全运行。但你不要放松警惕，风险仍然存在，有些风险不仅被放大了，而且针对生成式AI的新风险正在出现。如今似乎任何人都可以制作AI模型，即使你没有训练数...

人工智能 2024-05-28 人工智能

938阅读

欧盟ChatGPT工作组首次展示了如何解开AI聊天机器人的隐私合规性

欧盟数据保护任务组已经花费了一年多的时间，考虑了欧盟数据保护法规如何适用于 OpenAI 的 ChatGPT 聊天机器人，并于上周发布了初步结论。总的来说，这个隐私执法小组对于关键的法律问题，例如 OpenAI 的处理是否合法和公平，仍未达成一致意见。...

大数据 2024-05-28 人工智能

955阅读

一文读懂本地运行 LLM 的优秀实践方法

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM -常见的本地运行 LLM 方法。众所周知，如今使用 ChatGPT 等大型模型工具变得异常简单，只需通过浏览器在线访问即可。然而，需要注意的是，...

大数据 2024-05-28 人工智能

830阅读

国产大模型登陆国产系统！百度文心一言上架统信应用商店

快科技5月28日消息，统信UOS官方宣布，由百度研发的人工智能大语言模型产品文心一言正式上架统信应用商店。用户可通过统信应用商店一键下载、安装并使用文心一言。统信表示，文心一言的上架，是统信应用商店在智能技术领域的重要拓展。据了解，文心一言从去年3月...

大数据 2024-05-28 人工智能

741阅读

【AIGC调研系列】CogVLM2:第二代视觉大模型

CogVLM2是智谱AI推出的新一代多模态大模型，继承并优化了上一代模型的经典架构。CogVLM2采用了一个拥有50亿参数的强大视觉编码器，并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块[1]。这一设计使得CogVLM2在视觉和语言理解方面实现...

人工智能 2024-05-28 人工智能

1676阅读

人工智能AI和数字化世界走向何方

2024 年 5 月 23 日，美国众议院外交事务委员会以压倒性多数投票提交了一项法案，该法案将使拜登政府更容易限制 AI 系统的出口。该法案还将赋予美国商务部明确的权力，禁止美国人与外国人合作开发对美国国家安全构成威胁的 AI 系统。路透社本月报...

人工智能 2024-05-28 人工智能

888阅读

如何在本地搭建集成大语言模型Llama 2的聊天机器人并实现无公网IP远程访问

文章目录 1. 拉取相关的Docker镜像 2. 运行Ollama 镜像 3. 运行Chatbot Ollama镜像 4. 本地访问 5. 群晖安装Cpolar 6. 配置公网地址 7. 公网访问 8. 固定公网地址随着ChatGPT...

AIGC 2024-05-28 人工智能

1066阅读

一文读懂 Arthur Bench LLM 评估框架

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。众所周知，LLM 评估是人工智能领域的一个重要议题。随着 LLM 在各个场景中的广泛应用,评估它们的能力和局限性变得越来越重要。作为一款新兴...

生成式AI 2024-05-27 人工智能

828阅读

英伟达赢麻了！马斯克xAI超级算力工厂曝光，10万块H100、数十亿美元

最近几年，随着大语言模型的飞速发展与迭代，科技巨头们都竞相投入巨额财力打造超级计算机（或大规模 GPU 集群）。他们认为，更强大的计算能力是实现更强大 AI 的关键。早在 2022 年，Meta 即宣布与英伟达共同打造大型 AI 研究超级计算机「AI...

AIGC 2024-05-27 人工智能

832阅读

披萨上涂胶水、建议用户吃石头、毒蘑菇……谷歌又被大模型带沟里

继「把马斯克画成黑人」后，谷歌 AI 再度闯祸。近日，有网友使用谷歌的 AI Overview 功能进行搜索，却得到了一堆离谱的回答。例如，告诉用户在披萨上涂胶水，或者建议他们吃石头等。谷歌 AI「满嘴跑火车」的回答迅速在社交媒体上发酵，甚至有网友发...

生成式AI 2024-05-27 人工智能

822阅读

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

2003年夏天的一个周日，AI教父Hinton在多伦多大学的办公室里敲代码，突然响起略显莽撞的敲门声。门外站着一位年轻的学生，说自己整个夏天都在打工炸薯条，但更希望能加入Hinton的实验室工作。 Hinton问，你咋不预约呢？预约了我们才能好好谈谈。...

大数据 2024-05-27 人工智能

862阅读

多模态预训练模型在 OPPO 端云场景的落地实践

一、端侧图文检索技术研究 1. 解决了什么问题？首先来介绍图文检索技术。以前在手机端相册搜索照片，都是基于标签来搜索。从 CLIP 模型出现后开始做自然语言搜索。目前正在解决端侧性能、搜索效果、安全等问题。技术难度并不大，重点在于提高搜索速度。并...

生成式AI 2024-05-27 人工智能

947阅读