llm 第4页 - AIGC资讯

使用 Ollama、Llama 3.1 和 Milvus 进行函数调用案例

偶然看到一篇很短代码就能实现llama function call的文章。秉着学习加分项的原则，进行了实验测试。这里给出案例和全部改写后的代码。将 LLM 与函数调用相结合，就如同赋予您的 AI 连接世界的能力。通过将您的 LLM 与外部工具（例如用...

AIGC 2024-08-31 人工智能

1660阅读

无需本地部署！免费使用开源大模型API

之前，我给大家分享过几篇关于如何在本地部署开源大模型以及应用场景的文章。比如说，给本地大模型添加知识库、API的调用等等。在这个过程中，有粉丝反馈自己不会部署，或者电脑配置不好，想知道还有没有办法使用这些开源大模型。今天就来分享一个免费且无门槛使用各种...

生成式AI 2024-08-31 人工智能

4510阅读

Llama 3.1 这一最强模型按时降临！扎克伯格最新的访谈表明：Llama 将会成为 AI 领域中的 Linux 。

? 个人主页：TechCodeAI启航，公众号：TechCodeAI ?‍♂️ 作者简介：2020参加工作，专注于前端各领域技术，共同学习共同进步，一起加油呀！ ? 优质专栏：AI相关最新技术分享（目前在向AI方向发展，欢迎大佬交流） ? 资料...

生成式AI 2024-08-31 人工智能

863阅读

8G显存运行Llama 3.1 405B！

我正在接受挑战，在只有 8GB VRAM 的 GPU 上运行 Llama 3.1 405B 模型。 Llama 405B 模型有 820GB！这是 8GB VRAM 容量的 103 倍！显然，8GB VRAM 无法容纳它。那么我们如何让它工作呢？...

大数据 2024-08-31 人工智能

994阅读

【大模型理论篇】关于LLaMA 3.1 405B以及小模型的崛起

前不久，Meta开源了LLaMA 3.1 405B【1】，模型扩展了上下文长度至 128K，支持八种语言，效果非常惊艳，是首个在通用知识、可操控性、数学、工具使用和多语言翻译方面能够与最先进闭源 AI 模型媲美的公开可用模型，已经赶上截至目...

生成式AI 2024-08-31 人工智能

970阅读

一周打完1000场官司，中科院发布首个AI法庭AgentCourt

在人工智能重塑各个行业的今天，法律界也迎来了前所未有的变革。传统的法律实践面临着效率低下、成本高昂等挑战，而AI技术的出现为解决这些问题提供了新的可能。从最初斯坦福小镇火遍全网，25个由大语言模型（LLMs）驱动的智能体生活交友，打开了多Agent新视角...

大数据 2024-08-31 人工智能

915阅读

橙芯创想：香橙派AIPRO解锁升腾LLM与Stable Diffusion的创意密码

文章目录引言一. 香橙派AI PRO配置以及展示优秀的扩展能力实物展示二、Ascend-LLM模型部署开机 xshell连接香橙派实战运行部署运行结果分析开发版表现三、Stable Diffusion 文生图性能...

AIGC 2024-08-31 人工智能

1228阅读

一文搞懂大模型！基础知识、 LLM 应用、 RAG 、 Agent 与未来发展

LLM 探秘：想要深入了解人工智能界的“新宠”大型语言模型（LLM）吗？本文将带你走进 LLM 的世界，从入门知识到实际应用，全方位解读这个充满魔力的“大模型”。我们将一起揭开 LLM 的神秘面纱，领略其在各个领域的独特魅力。无论你是初学者还是有一定基础的...

大数据 2024-08-30 人工智能

1093阅读

论文分析｜高效长文本生成的技术与应用

Preface 前言目前大模型公司很多在追求长文a本，对算力需求极大，如何能够现实地处理该问题很重要。特别是随着Transformer模型尺寸和复杂性的增长，它们在训练期间的内存需求呈指数级增加。语言模型训练的瓶颈在于显存占用非常大，这需要创...

生成式AI 2024-08-30 人工智能

898阅读

AI日报：媲美GPT-4！智谱AI发布最新模型GLM-4-Plus；阿里重磅开源超强AI模型Qwen2-VL；国产AI神器NotePin在国外火了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、智谱AI震撼发布GLM-4-P...

人工智能 2024-08-30 人工智能

756阅读

全球3.5亿下载量破纪录！ Llama家族暴涨10倍，开源帝国掀AI革命

【新智元导读】诞生一年半，Llama家族早已稳坐开源界头把交椅。最新报告称，Llama全球下载量近3.5亿，是去年同期的10倍。而模型开源让每个人最深体会是，token价格一降再降。 Llama一举成为世界开源的领头羊。截至目前，Llama模型在开源平台...

人工智能 2024-08-30 人工智能

765阅读

【开发心得】Dify部署ollama模型的坑[1]

本文接续上次的文章【开发心得】三步本地化部署llama3大模型_dify llama3-CSDN博客经过几次调试，目前部署终于稳定下来，由于算力问题产生的300 time out也逐渐减少了。因此，把后续在测试过程中碰到的一些坑和怎么爬出来，做一个记录...

人工智能 2024-08-30 人工智能

12032阅读

探索Llama 3.1 : 405B参数模型：部署、硬件配置、测试与训练的心得

引言随着人工智能技术的快速发展，大规模语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了显著的突破。MetaAI最新发布的Llama 3.1 : 405B参数模型，凭借其庞大的参数规模和先进的架构，展...

大数据 2024-08-30 人工智能

2115阅读

ViT篇外：NVIDIA Llama-3.1-Minitron 4B

相关阅读： ViT：3 Compact Architecture MobileLLM：“苗条”的模型比较好！大家也许会很好奇为什么在ViT章节插入了NVIDIA Llama-3.1-Minitron 4B，ViT因为应用场景的特殊性所以都寄...

AIGC 2024-08-30 人工智能

737阅读

llama.cpp使用

llama.cpp的github库地址为ggerganov/llama.cpp: LLM inference in C/C++ (github.com ，具体使用以官方说明为准。简介 llama.cpp目标是在本地和云端的各种硬件上以最小的设置和最...

AIGC 2024-08-29 人工智能

2604阅读

Q-Copilot，基于Java+NapCatQQ+LLM+Tools构建的全新QQ AI机器人，打造私人助理，支持邮件发送，超级详细！！！

Q-Copilot简介传统的QQ机器人可以说几乎对自然语言没有理解能力，只能通过固定指令的方式进行特定任务是执行。比如查询天气，你只能说"天气深圳","01 深圳"，等类似固定指令，不管是从开发角度还是用户角度都极其机械化。...

生成式AI 2024-08-29 人工智能

1582阅读

英伟达Blackwell称霸MLPerf！推理性能暴涨30倍，新一代「AI怪兽」诞生

【新智元导读】MLPerf Inference发布了最新测试结果，英伟达最新的Blackwell架构芯片上场与谷歌、AMD同场竞技，展现出明显的性能提升，甚至刷新了部分任务上的测试纪录。大语言模型（LLM）推理是一个全栈挑战。为了实现高吞吐量、低延迟的...

生成式AI 2024-08-29 人工智能

769阅读

初识LLM大模型：入门级工程知识探索与解析

前言源自脉脉上面刷到的大模型业务工程落地可以做的方向。其实如果不是接触相关工作，有的人可能不会想了解这方面，自己实习做的方向与之相关，因此想调研总结一下行业热点方向与基础入门知识，还有一些的专业词汇的解释。包括但不限于Prompt工程、模型微调fin...

大数据 2024-08-29 人工智能

1042阅读

开源智能助手平台Dify是什么？

1.背景对于国内小公司，怎样通过Ai 将内部流程、产品重新做一次，从而提高人效、给客户带来价值，这是老板们在考虑的问题？当前市面上的你大模型例如：通义千问、文心一言、kimi、智谱清言、盘古等，底层能力都非常强大（千亿级参数），但各个模型使用有...

大数据 2024-08-29 人工智能

4078阅读

VAD-LLaMA：基于大语言模型的视频异常检测和解释（Video Anomaly Detection and Explanation via Large Language Models）

文章目录问题方法整体架构 VE and Feature Extraction Long-Term Context (LTC Module Feature Adaptor LLaMA 训练流程图第一阶段：训练VADor 第二阶段...

大数据 2024-08-29 人工智能

1060阅读

AIGC大模型实践总结（非常详细）零基础入门到精通，收藏这一篇就够了

大模型浪潮席卷全球，在各行各业中的重要性愈发凸显，呈现出一股不可逆转的发展趋势。这一年本人所在业产技也在这一过程中持续探索和尝试AIGC。本文一方面是对AIGC实践的总结回顾，同时也是本人学习实践AIGC过程中一些笔记、心得分享。因个人能力限制，文章中可能...

人工智能 2024-08-29 人工智能

982阅读

在LangChain中使用Llama.cpp：从安装到实践

在LangChain中使用Llama.cpp：从安装到实践引言 Llama.cpp是一个高效的C++库，用于在CPU上运行大型语言模型（LLMs）。本文将介绍如何在LangChain中集成和使用Llama.cpp，包括安装、设置以及使用LLM和嵌...

AIGC 2024-08-29 人工智能

1314阅读

GPT-5降临，代号猎户座？OpenAI疑用草莓训练，数学推理暴涨超越所有模型

OpenAI的下一代旗舰大语言模型，要来了? 据悉，新模型代号Orion（猎户座），就是能超越GPT-4的下一代模型。而猎户座的预训练数据，正是由草莓模型生成的。而草莓模型驱动的聊天机器人，很可能就会在今年秋天上线! 关于OpenAI的草莓，外媒The...

大数据 2024-08-28 人工智能

768阅读

全网最全RAG评估指南：全面解析RAG评估指标并提供代码示例

一、RAG痛点介绍最近我一直在关注和优化RAG（Retrieval-Augmented Generation）相关的内容，总结了一下RAG的痛点和最佳实践，然后重点会介绍如何评估RAG。二、RAG痛点优化认识了RAG的痛点，就知道如...

AIGC 2024-08-28 人工智能

1603阅读

大模型框架汇总：大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel

常见的大模型框架：大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel：大模型框架是指用于训练、推理和部署大型语言模型（LLMs）的软件工具和...

生成式AI 2024-08-28 人工智能

1592阅读

4060显卡+LLaMA-Factory微调LLM环境准备——（一）安装cuda

本地配置系统：win10**硬件：**i5-12490f+RTX4060 安装原因：最近尝试在本地对开源LLM进行Fine-tune的时候，用到了LLaMA-Factory，在运行的时候，弹出未检测到GPU，后来才发现，是忘记安装cuda等...

AIGC 2024-08-27 人工智能

2497阅读

LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设

模型越来越大，需要的 GPU 越来越多；与此同时 GPU 性能也在不断增强，配套的网络带宽也不断增加到 400G（Blackwell GPU 甚至需要到 800 Gbps）。Ranking 模型还在迁移到 GPU 的早期阶段，但使用 GPU 的规模也在不断...

生成式AI 2024-08-27 人工智能

1266阅读

使用FastChat快速部署LLM服务

原文：https://zhuanlan.zhihu.com/p/705915093 FastChat 是一个用于训练、服务和评估基于LLM的聊天机器人的开放平台，它的核心功能包括：最先进模型（例如 Vicuna、MT-Bench）的训练和评估代码。...

AIGC 2024-08-27 人工智能

957阅读

Code Llama使用手册

Code Llama 是 Llama 2 的一系列最先进的开放访问版本，专门用于代码任务，我们很高兴发布与 Hugging Face 生态系统的集成！ Code Llama 已使用与 Llama 2 相同的宽松社区许可证发布，并且可用于商业用途。今天，...

人工智能 2024-08-27 人工智能

1153阅读

【从Qwen2,Apple Intelligence Foundation,Gemma 2,Llama 3.1看大模型的性能提升之路】

从早期的 GPT 模型到如今复杂的开放式 LLM，大型语言模型 (LLM 的发展已经取得了长足的进步。最初，LLM 训练过程仅侧重于预训练，但后来扩展到包括预训练和后训练。后训练通常包括监督指令微调和校准，这是由 ChatGPT 推广的。自 Chat...

人工智能 2024-08-26 人工智能

995阅读

检索生成(RAG) vs 长文本大模型：实际应用中如何选择？

编者按：大模型的上下文理解能力直接影响到 LLMs 在复杂任务和长对话中的表现。本期内容聚焦于两种主流技术：长上下文(Large Context Windows 和检索增强生成(RAG 。这两种技术各有何优势？在实际应用中，我们又该如何权衡选择？文章...

人工智能 2024-08-26 人工智能

836阅读

小窗AI问答机有哪些功能？怎么使用方法详细教程指南

小窗AI问答机是什么？小窗® 对话式 AI 问答机是一款基于大语言模型（LLM）的人工智能技术产品，主要面向孩子群体，帮助他们在学习和生活中获取知识，提升独立思考、提问和语言表达能力。该产品的优点包括博学多知的超级博士、随时交谈的外语陪练、无穷创意的...

大数据 2024-08-26 人工智能

1388阅读

AI、AGI、AIGC与AIGC、NLP、LLM，ChatGPT区分

这些术语和技术都是人工智能（AI）领域的重要组成部分，它们之间有复杂的关系和相互交织的依存。以下是它们之间的关系和各自的定义： AI（人工智能）：定义：AI是指能够执行通常需要人类智能才能完成的任务的系统。这包括感知、推理、学习、决策和自...

生成式AI 2024-08-26 人工智能

937阅读

基于autodl与llama-factory部署llama3-8B开源大模型

一、注册与购买autodl实例注册了autodl账号以后，我们便可以在网站首页看到具体的实例信息，同时能够观察其具体的系统盘与数据盘以及缓存大小，对于我们即将微调的llama3开源大模型来说，通过资料的查询了解，我们只需要24G显存就可...

大数据 2024-08-25 人工智能

1535阅读

Llama 3.1深度解析：405B、70B及8B模型的多语言与长上下文处理能力

Llama 3.1 发布了！今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作，确保在 Hugging Face 生态系统中实现最佳集成。Hub 上现有八个开源权重模型 (3 个...

人工智能 2024-08-25 人工智能

1365阅读

You.com 希望区别于谷歌成为解决复杂工作查询的 AI 搜索引擎

计算机科学家 Richard Socher 早在斯坦福大学攻读博士学位时就构思了 You.com，但在 2009 年至 2014 年间，由于谷歌的统治地位，Socher 选择暂时搁置这一概念。随着提示工程的发展——即为生成式 AI 工具创建输入以生成所...

生成式AI 2024-08-25 人工智能

799阅读

五个优秀的免费 Ollama WebUI 客户端推荐

认识 Ollama 本地模型框架，并简单了解它的优势和不足，以及推荐了 5 款开源免费的 Ollama WebUI 客户端，以提高使用体验。什么是 Ollama？ Ollama 是一款强大的本地运行大型语言模型（LLM）的框架，它允许用户在自己...

人工智能 2024-08-25 人工智能

5042阅读

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改进模型！附代码

【导读】适逢Llama 3.1模型刚刚发布，英伟达就发表了一篇技术博客，手把手教你如何好好利用这个强大的开源模型，为领域模型或RAG系统的微调生成合成数据。 Epoch AI上个月刚刚发文[预言数据墙」迫近，结果英伟达转头就甩出了340B开源巨兽Ne...

生成式AI 2024-08-24 人工智能

843阅读

【LLM】一、利用ollama本地部署大模型

目录前言一、Ollama 简介 1、什么是Ollama 2、特点：二、Windows部署 1.下载 2.安装 3.测试安装 4.模型部署： 5.注意三、 Docker部署 1.do...

生成式AI 2024-08-24 人工智能

932阅读

摩尔线程开源音频理解大模型MooER：38小时训练5000小时数据

快科技8月23日消息，摩尔线程官方宣布，音频理解大模型MooER”（摩耳）已经正式开源，并公布在GitHub上：https://github.com/MooreThreads/MooER 目前开源的内容包括推理代码，以及5000小时数据训练的模型，后续还将...

大数据 2024-08-24 人工智能

692阅读

快速体验LoRA微调Llama3-8B模型以及海光DCU推理加速（曙光超算互联网平台国产异构加速卡）

序言本文以 LLaMA-Factory 为例，在超算互联网平台SCNet上使用异构加速卡AI 显存64GB PCIE，对 Llama3-8B-Instruct 模型进行 LoRA 微调、合并和推理。一、参考资料 github仓库代码：LLaM...

AIGC 2024-08-24 人工智能

4936阅读

基础模型在亚马逊的BEDROCK测试

前言通过 Amazon Bedrock，开发者可以轻松使用多种最新领先基础模型（FM）进行构建。本实验中，您将了解和体验到在 Amazon Bedrock 中模型的基础使用方法，以便您快速构建强大安全的大语言模型（LLM）应用，其中包括：...

AIGC 2024-08-23 人工智能

793阅读

通过剪枝与知识蒸馏优化大型语言模型：NVIDIA在Llama 3.1模型上的实践与创新

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

人工智能 2024-08-23 人工智能

818阅读

Llama-2-Open-Source-LLM-CPU-Inference 使用教程

Llama-2-Open-Source-LLM-CPU-Inference 使用教程 Llama-2-Open-Source-LLM-CPU-InferenceRunning Llama 2 and other Open-Source LLMs on...

大数据 2024-08-23 人工智能

815阅读

1张Nvidia A100 80G部署Lamma3 70b 4bit的性能测试

这里写自定义目录标题硬件部署模型硬件性能监控工具 GPU监控工具 CPU和系统内存监控工具部署框架命令测试脚本与结果输出定量token测试 prompt 脚本 Test Result 输入定量token测试 prom...

大数据 2024-08-23 人工智能

2006阅读

阿里开源语音大模型CosyVoice：3秒还原声音，从部署到克隆的完整指南

前言很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ，但是看到视频教程过于复杂了，最近又出现了一个剪辑《人民的名义》的短视频非常搞笑。我就找到了一款最新更加强大的声音克隆项目CosyVoice。CosyVoice 是阿里通义实验室在七...

AIGC 2024-08-23 人工智能

4496阅读

Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析

Llama 3.1 发布了！Llama 3.1 有三种规格: 8B 适合在消费者级 GPU 上进行高效部署和开发，70B 适合大规模 AI 原生应用，而 405B 则适用于合成数据、大语言模型 (LLM 作为评判者或蒸馏。这三个规格都提供基础版和指令调优...

生成式AI 2024-08-23 人工智能

2209阅读

Xinference安装及部署大模型

1. Xinference 介绍 Xorbits Inference (Xinference 是一个开源平台，用于简化各种 AI 模型的运行和集成。借助 Xinference，您可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理...

AIGC 2024-08-23 人工智能

5100阅读

stable diffusion+LangChain+LLM自动生成图片

最近都在研究和学习stable diffusion和langchain的相关知识，并且看到stable diffusion也是有类似于ChatGLM的api调用方式，那在想有没有可能将stable diffusion也集成到langchain中来呢？看到网...

人工智能 2024-08-23 人工智能

759阅读

GOLLIE : ANNOTATION GUIDELINES IMPROVE ZERO-SHOT INFORMATION-EXTRACTION

文章目录题目摘要引言方法实验消融研究题目 Techgpt-2.0:解决知识图谱构建任务的大型语言模型项目论文地址：https://arxiv.org/abs/2310.03668 摘要大...

生成式AI 2024-08-23 人工智能

877阅读