语言模型第13页

Llama.cpp大模型量化简明手册

大型语言模型 (LLM ，尤其是像 Mixtral 8x7b（467 亿个参数）这样的大型模型，对内存的要求非常高。当你尝试降低推理成本、提高推理速度或在边缘设备上进行推理时，这种内存需求就会变得明显。解决此问题的一个潜在方法是量化。在本文中，我们将使用易...

生成式AI 2024-06-09 人工智能

1758阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（三）使用 TRL 训练奖励模型

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-06-09 人工智能

1328阅读

Llama模型家族之使用 Supervised Fine-Tuning（SFT）微调预训练Llama 3 语言模型（十）使用 LoRA 微调常见问题答疑

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-06-09 人工智能

1085阅读

【AIGC半月报】AIGC大模型启元：2024.05（上）

AIGC大模型启元：2024.05（上） (1 Video Mamba Suite（Mamba视频领域应用） (2 KAN（全新神经网络架构） (3 Meshy 3（文本生成3D模型） (4 MemGPT（LLM记忆管理框架） (5 ...

大数据 2024-06-08 人工智能

1046阅读

AI | LLaMA-Factory 一个好用的微调工具

‘’ LLama Factory，这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程，并且易于访问，使用体验友好。此外，它还提供了由 Hiyouga 提供的 Hugging Face 空间，可...

AIGC 2024-06-08 人工智能

1400阅读

【推理框架】超详细！AIGC面试系列大模型推理系列(1)

本期问题聚焦于大模型的推理框架本期问题快览有哪些大模型推理框架了解vllm吗介绍下vllm的核心技术了解faster transformer吗介绍下faster transformer的核心技术了解Xinference吗了解l...

大数据 2024-06-08 人工智能

1727阅读

使用AIGC生成软件类图表

文章目录如何使用 AI 生成软件类图表什么是 Mermaid Mermaid 的图片如何保存？ mermaid.live Draw.io Mermaid可以画什么图？流程图时序图 / 序列图类图状态图甘特图实体关系图 /...

大数据 2024-06-08 人工智能

820阅读

【AIGC调研系列】DeepSeek模型的优势和劣势

DeepSeek模型的优势主要包括：多模态能力：DeepSeek-VL能够在不丢失语言能力的情况下融入多模态能力，能够处理包括逻辑图、网页、公式识别、科学文献、自然图像等多种类型的数据，显示出其强大的通用多模式理解能力[1]。高分辨率图片输入：...

人工智能 2024-06-08 人工智能

6252阅读

2023年度佳作：AIGC、AGI、GhatGPT 与人工智能大模型的创新与前景展望_ghatai

还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。对于有1-3年工作经验，想要跳槽的...

AIGC 2024-06-08 人工智能

1001阅读

探索GGUF：利用llama.cpp高效运行大型语言模型

探索GGUF：利用llama.cpp高效运行大型语言模型在人工智能领域，大型语言模型（LLM）的应用越来越广泛，但运行这些模型常常需要大量计算资源和复杂的配置。最近，一个名为llama.cpp的开源项目引起了广泛关注，它通过C/C++实现了一个高效的...

AIGC 2024-06-08 人工智能

1134阅读

全新推理框架SymbCoT 让大模型实现类人的符号逻辑推理能力

新加坡国立大学联合加州大学圣芭芭拉分校与奥克兰大学的研究人员提出了一种名为SymbCoT（Symbolic Chain-of-Thought）的全新推理框架，旨在提升大语言模型(LLMs 的符号逻辑推理能力。这一框架结合了符号化逻辑表达式与思维链，极大提升...

AIGC 2024-06-07 人工智能

982阅读

每日AIGC最新进展(6)：视觉一致插图序列生成、阿里巴巴电商人物产品互动图生成、Text-to-Vector生成、多视图扩散模型3D重建

Diffusion Models专栏文章汇总：入门与实战 Generating Coherent Sequences of Visual Illustrations for Real-World Manual Tasks http://arxiv....

大数据 2024-06-07 人工智能

756阅读

OpenAI新作署名Ilya，提取1600万个特征看透GPT-4大脑！

【新智元导读】今天，OpenAI发布了一篇GPT-4可解释性的论文，似乎是作为前两天员工联名信的回应。网友细看论文才发现，这居然是已经解散的「超级对齐」团队的「最后之作」。前两天，OpenAI的一群员工刚刚联名发表公开信，表示自主的AI系统正在失控，呼吁...

人工智能 2024-06-07 人工智能

755阅读

Chrome浏览器将内置AI大模型Gemini Nano 新版开启内测

Chrome团队宣布，正在探索“内置 AI”概念，即浏览器将具有内置 AI 模型，以便为浏览器功能和网络平台 API 启用设备上的 AI。官方介绍称，借助内置 AI，您的网站或 Web 应用将能够针对基础模型和专家模型运行各种 AI 任务，而无需担心部...

AIGC 2024-06-07 人工智能

915阅读

Galileo发布Luna，重新定义GenAI评估，成本降低97%、速度提升11倍

企业人工智能技术领先者 Galileo 近日发布了一款名为 Luna 的全新产品，这一革命性的 Evaluation Foundation Models 套件重新定义了企业对 GenAI 系统的评估方式。Luna 承诺在速度、成本和准确性方面进行了前所未有...

生成式AI 2024-06-07 人工智能

821阅读

【AIGC调研系列】Phi-3 VS Llama3

2024-04-24日发布的Phi-3系列模型在多个方面展现出了对Llama-3的性能优势。首先，Phi-3-small（7B参数）在MMLU上的得分高于Llama-3-8B-Instruct模型，分别为75.3%和66%[1]。此外，具有3.8B参数的P...

生成式AI 2024-06-07 人工智能

853阅读

一文讲清楚，AI、AGI、AIGC与AIGC、NLP、LLM，ChatGPT等概念

前言随着chatgpt3.5的横空出试，大模型爆火，这个风暴传递到了各行各业。各类公众号、帖子，也涌现出了各种概念，AI、大模型、LLM、AI、AIGC、AGI、GPT、ChatGPT等等。总觉得被这些概念搞得头晕。我花了点时间，梳理了下...

大数据 2024-06-07 人工智能

1198阅读

Llama模型家族训练奖励模型Reward Model技术及代码实战（一）

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

AIGC 2024-06-07 人工智能

941阅读

在本地跑一个AI模型(5) - Stable Diffusion

在之前的文章中，我们使用ollama在本地运行了大语言模型，它可以与你聊天，帮助你理解和生成文本内容。使用coqui-tts在本地运行了文本转语音模型，它可以将大语言模型生成的文字转换成语音，让你的应用更有趣。今天我们将要介绍Stable Diffusio...

生成式AI 2024-06-06 人工智能

914阅读

这个团队做了OpenAI没Open的技术，开源OpenRLHF让对齐大模型超简单

随着大型语言模型（LLM）规模不断增大，其性能也在不断提升。尽管如此，LLM 依然面临着一个关键难题：与人类的价值和意图对齐。在解决这一难题方面，一种强大的技术是根据人类反馈的强化学习（RLHF）。但是，随着模型越来越大，RLHF 通常需要维持多个模型...

生成式AI 2024-06-06 人工智能

725阅读

LLM微调技术LoRA图解

译者 | 朱先忠审校 | 重楼简介当涉及到大型语言模型时，微调可能是人们讨论最多的技术方面的内容之一。大多数人都知道，训练这些模型是非常昂贵的，需要大量的资本投资;所以，看到我们可以通过采用现有的模型并用自己的数据对模型进行微调，从而创建一个具有...

人工智能 2024-06-06 人工智能

863阅读

Stable Diffusion老板跑路开新坑，被抛下的SD3开源成了烂摊子

Stability AI前CEO的新公司，终于浮出水面： Schelling AI，就如他当初辞职跑路时所说，致力于“去中心化人工智能系统”。 △图源：?@irfan3 这一消息，由Emad Mostaque本人在最新一次公开亮相中现场宣布。官网域名s...

大数据 2024-06-06 人工智能

756阅读

照片特定风格变换Stylar AI；GPT-4V开源替代方案InternVL；纯C/C++实现的Stable Diffusion库；基于AI的数据爬取

✨ 1: AI Photo Filter Stylar AI是一款功能强大的AI图像编辑与设计工具，提供无与伦比的图片组合和风格控制。 AI Photo Filter，简言之，就是使用人工智能技术来改善或改变图片的风格、质量和元素组合的一种...

生成式AI 2024-06-06 人工智能

914阅读

快手版Sora「可灵」开放测试：生成超120s视频，更懂物理，复杂运动也能精准建模

什么？疯狂动物城被国产AI搬进现实了？与视频一同曝光的，是一款名为「可灵」全新国产视频生成大模型。它采用了Sora相似的技术路线，结合多项自研技术创新，生成的视频不仅运动幅度大且合理，还能模拟物理世界特性，具备强大的概念组合能力和想象力。数据上看...

大数据 2024-06-06 人工智能

854阅读

OpenAI 和谷歌 DeepMind已风险重重，13位硅谷AI大厂员工联名上信：我们需要对前沿AI发出警告的权利！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）忍无可忍！面对AI技术发展的各种风险隐患，这些前沿AI企业的一线员工再也不堪忍受任人捂嘴的现状了！他们想要挣脱保密协议和公司报复的重重风险，获得对公众发出警告的权利。昨...

人工智能 2024-06-06 人工智能

700阅读

Github万星！北航发布零代码大模型微调平台LlamaFactory

在人工智能领域，大语言模型（LLMs）已成为推动技术进步的关键力量。它们在理解和生成自然语言方面展现出了卓越的能力，从而在问答系统、机器翻译、信息提取等多样化任务中发挥着重要作用。然而，要将这些模型适配到特定的下游任务中，通常需要进行微调（fine-tun...

人工智能 2024-06-06 人工智能

1116阅读

LLM | Yuan 2.0-M32：带注意力路由的专家混合模型

图片一、结论写在前面 Yuan 2.0-M32，其基础架构与Yuan-2.0 2B相似，采用了一个包含32位专家的专家混合架构，其中2位专家处于活跃状态。提出并采用了一种新的路由网络——注意力路由器，以更高效地选择专家，相比采用经典路由网络的模型，其准...

人工智能 2024-06-06 人工智能

921阅读

在OpenHarmony本地部署大语言模型

本文将第二届OpenHarmony技术大会上展示的《在OpenHarmony本地部署大语言模型》成果开源，开源地址：https://gitee.com/openharmony-sig/tpc_c_cplusplus/blob/master/thirdp...

人工智能 2024-06-06 人工智能

1064阅读

使用llama-index连接neo4j知识图谱达成大模型构建查询知识图谱功能

使用llama-index连接neo4j知识图谱达成本地大模型构建查询知识图谱功能概述目标主要步骤 1. 安装依赖项 2. 配置环境配置ollama 3. 使用Neo4j构建知识图谱准备Neo4j 实例化Neo4jGraph...

生成式AI 2024-06-06 人工智能

1461阅读

别再说国产大模型技术突破要靠 Llama 3 开源了

近日，千呼万唤之下，Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本，再次震动 AI 圈。 Meta 表示，Llama 3 已经在多种行业基准测试上展现了最先进的性能，提供了包括改进的推理能力在内的新功能，是目前市场上最好的开源大模型...

生成式AI 2024-06-06 人工智能

804阅读

重磅 Llama-3最强开源大模型惊艳亮相

重磅！Llama-3，最强开源大模型正式发布！     202年4 月 19 日，Meta 发布开源大模型 Llama-3，助力研究人员和开发者推进语言 AI 的界限。强大的语言模型Llama-3推出，拥有80亿...

人工智能 2024-06-05 人工智能

1188阅读

使用LangChain和Llama-Index实现多重检索RAG

大家好，在信息检索的世界里，查询扩展技术正引领着一场效率革命。本文将介绍这一技术的核心多查询检索，以及其是如何在LangChain和Llama-Index中得到应用的。 1.查询扩展查询扩展是一种信息检索技术，通过在原始查询的基础上增加相关或同义的词...

人工智能 2024-06-05 人工智能

814阅读

CLIP当RNN用入选CVPR：无需训练即可分割无数概念｜牛津大学&谷歌研究院

循环调用CLIP，无需额外训练就有效分割无数概念。包括电影动漫人物，地标，品牌，和普通类别在内的任意短语。牛津大学与谷歌研究院联合团队的这项新成果，已被CVPR 2024接收，并开源了代码。团队提出名为CLIP as RNN（简称CaR）的新技...

大数据 2024-06-05 人工智能

853阅读

ChatGPT之父最新预测！中国将有自己的特色大模型

快科技6月5日消息，在近日的2024年人工智能向善全球峰会（AI for Good Global Summit）上，ChatGPT之父、OpenAI首席执行官奥特曼提出了对中国人工智能发展的最新预测。他认为，中国将发展出具有自身特色的大型语言模型，并在这...

大数据 2024-06-05 人工智能

796阅读

利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速

一、Riva 概览 1. Overview Riva 是 NVIDIA 推出的一款 SDK，用于实时的 Speech AI 服务。它是一个高度可定制的工具，并且使用 GPU 进行加速。NGC 上提供了很多预训练好的模型，这些模型开箱即用，可以直接使用...

大数据 2024-06-05 人工智能

998阅读

思科推出10亿美元人工智能基金，重点与AI公司合作创新

思科推出10亿美元的人工智能投资基金，旨在支持创新 AI 技术的发展。与其他公司不同，思科强调这一举措不仅仅是投入资金，更注重与公司合作共同创新。思科计划成为 AI 领域的提供者和平台，与初创公司进行合作，共同推动 AI 技术的发展。近期，思科宣布与...

生成式AI 2024-06-05 人工智能

810阅读

llama.cpp制作GGUF文件及使用

llama.cpp的介绍 llama.cpp是一个开源项目，由Georgi Gerganov开发，旨在提供一个高性能的推理工具，专为在各种硬件平台上运行大型语言模型（LLMs）而设计。这个项目的重点在于优化推理过程中的性能问题，特别是针对CPU环境。以...

人工智能 2024-06-05 人工智能

1388阅读

GPT-4o与SQL：大模型改变自身架构的能力有多强？

作者丨David Eastman 编译丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）尽管没有任何大型语言模型（LLM）骑过自行车，但它们显然理解骑行在人类交通领域中的作用。它们似乎为软件开发者提供的是一种类似语义的现实世界知识，结合了...

AIGC 2024-06-05 人工智能

758阅读

扩散模型的技术原理和应用价值

引言一、扩散模型的基本概念扩散模型(Diffusion Models 是一种基于概率论的生成模型，最初源自物理学中的扩散过程理论，比如墨水在水中的扩散过程。在机器学习领域，这一概念被创造性地应用于数据生成任务，特别是图像和声音的合成。它们通过模拟一个...

AIGC 2024-06-05 人工智能

1264阅读

【完整指南】如何在Visual Studio Code中轻松运行Llama 3模型？

Meta 发布了最新的开源语言模型Llama 3。因为它是开源的，你可以下载这个模型，并在自己的电脑上运行。我清楚，你可能会想，在个人笔记本上运行一个拥有80亿参数的AI模型似乎只有技术高手才能做到。但别担心！这篇文章会提供一个简单的步骤指导，帮助每个...

大数据 2024-06-05 人工智能

991阅读

文心一言：百度AI大语言模型的崛起

文心一言：百度AI大语言模型的崛起 1. 背景介绍 1.1 人工智能的发展历程人工智能(Artificial Intelligence, AI 是当代科技发展的重要领域,自20世纪50年代诞生以来,已经经历了几个重要的发展阶段。早期的人工智能系统主...

生成式AI 2024-06-05 人工智能

894阅读

科学家利用GenAI发现物理学新见解

在生成式人工智能（GenAI）帮助下，麻省理工和瑞士巴塞尔大学的研究人员开发了一种新的机器学习（ML）框架，可以帮助发现关于材料科学的新见解。这项研究的结果发表在《物理评论快报》上。当水从液体转变为固体时，它经历了重要的转变性质，如体积和密度。水的相...

大数据 2024-06-05 人工智能

818阅读

智谱AI宣布开源 GLM 第四代模型 GLM-4-9B

GLM 技术团队于2023年3月14日开源了 ChatGLM-6B，引起了广泛的关注和认可。随后又开源了 ChatGLM3-6B，开发者对 GLM 第四代模型的开源充满期待。经过近半年的探索工作，GLM 技术团队推出了第四代 GLM 系列开源模型:GLM-...

人工智能 2024-06-05 人工智能

916阅读

大模型到底有没有智能？一篇文章给你讲明明白白

生成式人工智能 (GenAI[1] 和大语言模型 (LLM[2] ，这两个词汇想必已在大家的耳边萦绕多时。它们如惊涛骇浪般席卷了整个科技界，登上了各大新闻头条。ChatGPT，这个神奇的对话助手，也许已成为你形影不离的良师益友。然而，在这场方兴未艾的...

人工智能 2024-06-05 人工智能

945阅读

迈向『闭环』| PlanAgent：基于MLLM的自动驾驶闭环规划新SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的文本提示为输入，利用多模态大语言模型的多...

大数据 2024-06-05 人工智能

1116阅读

LLM | 偏好学习算法并不学习偏好排序

图片一、结论写在前面偏好学习算法（Preference learning algorithms，如RLHF和DPO）常用于引导大型语言模型（LLMs）生成更符合人类偏好的内容，但论文对其内部机制的理解仍有限。论文探讨了传统观点，即偏好学习训练模型通过...

人工智能 2024-06-05 人工智能

895阅读

本地使用Groq Llama 3 70B的逐步指南

译者 | 布加迪审校 | 重楼本文介绍了如何使用Groq LPU推理引擎在Jan AI和VSCode中生成超快速响应。每个人都致力于构建更好的大语言模型(LLM ，而Groq专注于AI的基础设施方面，旨在确保这些大模型更快速响应。本教程将介绍...

人工智能 2024-06-05 人工智能

1226阅读

为什么斯坦福大学生要抄袭中国大模型？

“他们会设法复制一切，却无法复制我的思想，我让他们辛苦偷窃，却永远落后我一年半载。”——Rudyard Kipling（印度作家）美国大模型抄袭了中国? 6月初，一些眼尖的网友发现，一个来自美国斯坦福大学的AI团队于5月29日发布了一款名为Llama3V...

人工智能 2024-06-05 人工智能

805阅读

写代码神器！48个主流代码生成LLM大模型盘点，包含专用、微调等4大类Code llama

写代码神器！48个主流代码生成LLM大模型盘点，包含专用、微调等4大类学姐带你玩AI 2023-12-06 18:20 代码大模型具有强大的表达能力和复杂性，可以处理各种自然语言任务，包括文本分类、问答、对话等。这些模型通常基于深度学习架构，如Tra...

AIGC 2024-06-05 人工智能

2081阅读

套壳丑闻让斯坦福AI Lab主任怒了！抄袭团队2人甩锅1人失踪、前科经历被扒，网友：重新认识中国开源模型

斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭，其中两位来自斯坦福的本科生还跟另一位作者切割了。最新致歉推文，由Siddharth Sharma（悉达多）和Aksh Garg（阿克什）发出。不在其中、来自南加利福尼亚大学的M...

大数据 2024-06-04 人工智能

762阅读