-
使用llama.cpp在linux cuda环境部署llama2方法记录及遇到的问题
一、编译lllama.cpp 拉取llama.cpp库 cd llama.cpp make LLAMA_CUBLAS=1 LLAMA_CUDA_NVCC=/usr/local/cuda/bin/nvcc bug:编译问题 使用make,nv...
-
5.llama.cpp编译及使用
llama.cpp的编译及使用 下载源码 llama.cpp https://github.com/ggerganov/llama.cpp ggml 向量库 https://github.com/ggerganov/ggml 安装依赖库...
-
开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(一)
一、前言 语音转文本技术具有重要价值。它能提高信息记录和处理的效率,使人们可以快速将语音内容转换为可编辑、可存储的文本形式,方便后续查阅和分析。在教育领域,可帮助学生更好地记录课堂重点;在办公场景中,能简化会议记录工作。同时,该技术也为残障人士提...
-
一次copilot问题处理
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、问题描述 二、解决步骤 1.询问关键词 2.询问问题 3.询问解决方案 总结 前言 记录一次使用copilot解决问题的流程,以...
-
使用llama-index连接neo4j知识图谱 达成大模型构建查询知识图谱功能
使用llama-index连接neo4j知识图谱 达成本地大模型构建查询知识图谱功能 概述 目标 主要步骤 1. 安装依赖项 2. 配置环境 配置ollama 3. 使用Neo4j构建知识图谱 准备Neo4j 实例化Neo4jGraph...
-
[从0开始AIGC][Transformer相关]:算法的时间和空间复杂度
一、算法的时间和空间复杂度 文章目录 一、算法的时间和空间复杂度 1、时间复杂度 2、空间复杂度 二、Transformer的时间复杂度分析 1、 self-attention 的时间复杂度 2、 多头注意力机制的时间复杂度 三...
-
Llama改进之——SwiGLU激活函数
引言 今天介绍LLAMA模型引入的关于激活函数的改进——SwiGLU1,该激活函数取得了不错的效果,得到了广泛地应用。 SwiGLU是GLU的一种变体,其中包含了GLU和Swish激活函数。 GLU GLU(Gated Linear Units...
-
别再说国产大模型技术突破要靠 Llama 3 开源了
近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。 Meta 表示,Llama 3 已经在多种行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型...
-
GPT3.5、GPT4及Midjourney中转接口ChatGPT系统KEY使用方法
很多使用ChatGPT系统、还有SparkAi、NineAi等系统都存在个比较烦的问题,Openai API 3.5KEY 4.0KEY,Midjourney接口KEY都没有一个稳定的购买或者使用渠道。直连KEY买来还得得建立反代主机,Midjourney...
-
开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(二)
一、前言 语音转文本技术具有重要价值。它能提高信息记录和处理的效率,使人们可以快速将语音内容转换为可编辑、可存储的文本形式,方便后续查阅和分析。在教育领域,可帮助学生更好地记录课堂重点;在办公场景中,能简化会议记录工作。同时,该技术也为残障人士提...
-
手把手教你调用文心一言API,含py调用示例代码
获取API密钥 打开网址:百度智能云千帆大模型 (baidu.com 注册或登录账号 选择应用接入 创建应用 随便起个名字 点击显示即可。 这个API Key和Secret Key就是我们需要的。 Pyth...
-
智谱AI Open Day:升级清言App、发布GLM-4开源模型、新一代MaaS平台,大模型商业化迎来“下一站”
“描绘宏大未来愿景的同时让更多人切身体会到大模型的强大能力,让大模型技术从炫酷的天空当中真正落到地面上、落到实处,是每一个大模型公司必须思考的问题。”——智谱 AI CEO 张鹏 6月5日,智谱AI Open Day在UCCA Lab北京艺术空间举办。...
-
10款白嫖党必备的ai写作神器,你都知道吗? #学习#学习
你是否因为写作困顿而感到沮丧?是不是希望能够找到一个能给你提供无限灵感和提高创作效率的利器?AI写作助手就是你的绝佳选择!现在我向大家推荐几款好用的AI写作助手,它们将让你的创作之旅更加流畅、富有创意。 1.飞鸟写作 这是一个微信公众号 面向...
-
北京9岁小学生,已经用AI出书了!罗永浩围观:有事找不到我找AI
一个年仅9岁的男孩,利用AI智能体,竟然出版了一本书! 他叫许萌萌,是来自北京市第二实验小学的一名三年级学生。 萌萌与AI智能体共创的书叫做《AI少年——火星生存大挑战》,是一本科普小说,讲述了发生在火星上的“密室逃脱”的故事。 而他所选用的AI,正...
-
面向AIGC的InfiniBand网络技术特性分析
在AIGC的训练场景,基本上不差钱的客户都会首选InfiniBand,作为跨AI服务器节点的网络组网方案,今天我们就来讲一讲InfiniBand到底有那些针对AIGC场景的技术优化: &nbs...
-
腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题
过去十年间,基于随机梯度下降(SGD)的深度学习模型在许多领域都取得了极大的成功。与此同时各式各样的 SGD 替代品也如雨后春笋般涌现。在这些众多替代品中,Adam 及其变种最受追捧。无论是 SGD,还是 Adam,亦或是其他优化器,最核心的超参数非 L...
-
重磅 Llama-3最强开源大模型惊艳亮相
重磅!Llama-3,最强开源大模型正式发布! 202年4 月 19 日,Meta 发布开源大模型 Llama-3,助力研究人员和开发者推进语言 AI 的界限。 强大的语言模型Llama-3推出,拥有80亿...
-
英特尔牙膏挤爆:功耗降40%、AI算力120TOPS,你的下一代笔记本没有内存条了
英特尔为了AI,再次做出重大架构变革: 像手机一样搞起SoC(系统级芯片),你的下一台笔记本不会再有独立内存条。 刚刚推出的新一代AI PC低功耗移动平台架构Lunar Lake,采用全新MoP(Memory on Package)封装,片上集成16或3...
-
使用LangChain和Llama-Index实现多重检索RAG
大家好,在信息检索的世界里,查询扩展技术正引领着一场效率革命。本文将介绍这一技术的核心多查询检索,以及其是如何在LangChain和Llama-Index中得到应用的。 1.查询扩展 查询扩展是一种信息检索技术,通过在原始查询的基础上增加相关或同义的词...
-
把整个地球装进神经网络,北航团队推出全球遥感图像生成模型
北航的研究团队,用扩散模型“复刻”了一个地球? 在全球的任意位置,模型都能生成多种分辨率的遥感图像,创造出丰富多样的“平行场景”。 而且地形、气候、植被等复杂的地理特征,也全都考虑到了。 受Google Earth启发,北航的研究团队从俯拍视角出发,将...
-
你如何看待AIGC技术?
你如何看待AIGC技术? AIGC技术(Artificial Intelligence Generated Content)是指由人工智能生成的内容。它在许多领域都有应用,包括自然语言处理、图像生成、音频合成等。虽然这些技术可以提高效率和创造力,但也需...
-
CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院
循环调用CLIP,无需额外训练就有效分割无数概念。 包括电影动漫人物,地标,品牌,和普通类别在内的任意短语。 牛津大学与谷歌研究院联合团队的这项新成果,已被CVPR 2024接收,并开源了代码。 团队提出名为CLIP as RNN(简称CaR)的新技...
-
这些AI写作工具竟能预测热点,让你的文章永远领先一步
在当下社会,AI技术正以惊人的速度发展,它不仅改变了我们的生活方式,也极大地提升了工作效率。各种AI应用如写作助手、绘画软件、音频编辑工具以及图像处理软件层出不穷,它们正帮助我们以更高效的方式完成各种任务。特别是AI写作工具,它们已经成为许多写作者的得力助...
-
微软正式发布Copilot for Security
微软公司近日宣布,其备受期待的安全自动化解决方案——Copilot for Security现已全面上市,面向全球用户开放。这一创新工具的推出标志着微软在提升企业安全防护能力方面迈出了重要一步,同时也为安全专业人士提供了强大的支持。 Copilot fo...
-
如何利用人工智能增强API和微服务的云安全
译者 | 李睿 审校 | 重楼 概述 API是一组指导方针和协议,用于促进软件应用程序之间的通信。它概述了软件组件交互的方法,简化了开发和集成系统的过程。 微服务架构代表了一种将大型应用程序划分为多个服务的软件开发方法。每个服务集中于一个业务功能。...
-
Stable Diffusion安装(非秋叶包一键部署)
Stable Diffusion安装与配置详细步骤 一 、下载前置资源 下载CUDA 1. 查看CUDA版本 通过以下命令查看CUDA版本: nvidia-smi 复制 确保CUDA版本符合要求。 2. 下载CUDA ...
-
90%的组织在未来两年内将面临严重的技术人才短缺困境
根据调研机构IDC公司发布的一份研究报告,除了人工智能技能,IT运营和云开发技能也严重缺乏。 日益严重的IT技能短缺正在阻碍组织完成数字化项目和采用包括生成式人工智能(genAI 在内的新技术,并且它正在以多种方式触及底线。 IDC公司最近对800多名...
-
ChatGPT之父最新预测!中国将有自己的特色大模型
快科技6月5日消息,在近日的2024年人工智能向善全球峰会(AI for Good Global Summit)上,ChatGPT之父、OpenAI首席执行官奥特曼提出了对中国人工智能发展的最新预测。 他认为,中国将发展出具有自身特色的大型语言模型,并在这...
-
LLM并发加速部署方案(llama.cpp、vllm、lightLLM、fastLLM)
大模型并发加速部署 解析当前应用较广的几种并发加速部署方案! llama.cpp、vllm、lightllm、fastllm四种框架的对比: llama.cpp:基于C++,①请求槽,②动态批处理,③CPU/GPU混合推理 vllm:基于Pyth...
-
利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速
一、Riva 概览 1. Overview Riva 是 NVIDIA 推出的一款 SDK,用于实时的 Speech AI 服务。它是一个高度可定制的工具,并且使用 GPU 进行加速。NGC 上提供了很多预训练好的模型,这些模型开箱即用,可以直接使用...
-
最新国内AI工具(ChatGPT4.0、GPTs、AI绘画、文档分析使用教程)
如何利用AI提高内容生产效率? AI(人工智能)正以惊人的速度改变我们的生活方式,尤其是在内容生产领域。作为一名创作者,你可能会发现自己在面对海量信息时无从下手,或者在紧迫的截止日期前感觉力不从心。这时候,AI的出现如同一束曙光,为我们提供了极大的...
-
GPT-4o 的高阶用法,效率飞升!
大家好,我是老渡。 GPT-4o 已经是非常强的大模型了,这么强大的模型,如果再配上优秀的 prompt(提示词) 和工具,分分钟构造出更强大的智能体。 智能体 = prompt + LLM + 工具 先来说说如何写出优秀的 prompt,以下面这个 p...
-
亚马逊云科技:驾驭生成式 AI 力量,助力行业差异化创新
随着技术的飞速发展,生成式 AI 正逐渐成为全球经济增长的新引擎,为各行各业带来前所未有的创新机遇。据麦肯锡的研究报告预测,到 2030 年前,生成式 AI 有望为全球经济贡献 7 万亿美元的价值。其中,作为 AI 研发高地之一的中国,将凭借战略性投资分...
-
最强辅助上线!Backseat AI:英雄联盟的免费AI游戏伴侣
Backseat AI是一款由Riot Games批准的免费AI伴侣,专为《英雄联盟》玩家设计。它通过语音覆盖和游戏内评论的形式,为玩家提供实时的游戏评论和建议,包括购买建议和对线策略等。 这个AI伴侣旨在帮助玩家提升游戏表现,同时确保不会影响游戏性能。...
-
ai写作哪个好用?助你畅享文案创作乐趣
春天的气息弥漫在每个角落,四月的美景如诗如画,让人心生向往。最近,“人间四月天”的话题在网络上引起了热烈讨论,大家都在分享自己眼中的春日美景。 然而,想要在朋友圈中分享一段既唯美又动人的文案,却常常感到词穷,不知道如何下笔。这时候,一款好的AI写作软...
-
黎曼猜想显著突破!陶哲轩强推MIT、牛津新论文,37岁菲尔兹奖得主参与
黎曼猜想是数学中一个非常重要的未解决问题,与素数分布的精确性质有关(素数是那些只能被 1 和自身整除的数字,它们在数论中扮演着基础性的角色)。 在当今的数学文献中,已有超过一千条数学命题以黎曼猜想(或其推广形式)的成立为前提。也就是说,黎曼猜想及其推广形...
-
思科推出10亿美元人工智能基金,重点与AI公司合作创新
思科推出10亿美元的人工智能投资基金,旨在支持创新 AI 技术的发展。与其他公司不同,思科强调这一举措不仅仅是投入资金,更注重与公司合作共同创新。思科计划成为 AI 领域的提供者和平台,与初创公司进行合作,共同推动 AI 技术的发展。 近期,思科宣布与...
-
llama.cpp制作GGUF文件及使用
llama.cpp的介绍 llama.cpp是一个开源项目,由Georgi Gerganov开发,旨在提供一个高性能的推理工具,专为在各种硬件平台上运行大型语言模型(LLMs)而设计。这个项目的重点在于优化推理过程中的性能问题,特别是针对CPU环境。以...
-
GPT-4o与SQL:大模型改变自身架构的能力有多强?
作者丨David Eastman 编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 尽管没有任何大型语言模型(LLM)骑过自行车,但它们显然理解骑行在人类交通领域中的作用。它们似乎为软件开发者提供的是一种类似语义的现实世界知识,结合了...
-
盘点GPT-4o十大创意玩法!挑水果、看牙片、全自动化炒股,看完格局瞬间打开
自从OpenAI发布GPT-4o以来,“头号AI玩家”每天的状态be like:新语音模式上线了吗? 是的,还没有,但应该快了。 不过,毕竟GPT-4o已经上线半个月多,虽然新语音模式迟迟未来,但这不影响网友们用它整活儿。本期,“头号AI玩家”全方位盘点...
-
人工智能 | 360自研可控布局AI绘画模型HiCo发布
龙年春意伊始,360人工智能研究院正式发布新的AI绘画模型:可控布局生成模型HiCo。与大家所熟悉的文生图模型相比,HiCo在普通的文本输入之上,提供了更为强大的画面布局控制能力:用户可以根据自己的构思,指定在画面不同的区域生成不同的指定内容,实现A...
-
扩散模型的技术原理和应用价值
引言 一、扩散模型的基本概念 扩散模型(Diffusion Models 是一种基于概率论的生成模型,最初源自物理学中的扩散过程理论,比如墨水在水中的扩散过程。在机器学习领域,这一概念被创造性地应用于数据生成任务,特别是图像和声音的合成。它们通过模拟一个...
-
微软推出全新“贴纸制作器”:AI加持 自由创建个性化贴纸
快科技6月5日消息,微软旗下AI图像编辑器Microsoft Designer推出了全新贴纸制作器”功能,使用户能够自由创建个性化的贴纸。 据悉,微软旗下AI图像编辑器Microsoft Designer推出了全新贴纸制作器”功能,使用户能够自由创建个性化...
-
LLMs之llama3-from-scratch:llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码)的简介、核心思路梳理
LLMs之llama3-from-scratch:llama3-from-scratch(从头开始利用pytorch来实现并解读LLaMA-3模型的每层代码 的简介、核心思路梳理 导读:这篇论文实现了transformer网络的llama3模型...
-
如何利用生成式AI提高供应链弹性?
工业部门和全球供应链正在经历前所未有的时代。从全球新冠疫情爆发到地缘政治动荡,制造业的传统观念正在受到挑战,为了更好地适应新的变化,制造企业需要重新评估一些长期存在的做法。 最近的一个例子凸显了行业供应链重新评估的必要性:海运价格受红海危机的影响持续上...
-
生数科技完成数亿元 Pre-A 轮融资 加速布局多模态大模型
生数科技完成数亿元 Pre-A 轮融资,该轮融资由北京市人工智能产业投资基金、百度联合领投,中关村科学城公司等跟投,启明创投等数位老股东继续支持。此前,生数科技已经获得来自蚂蚁集团、BV百度风投、卓源亚洲、锦秋基金、达泰资本、智谱AI等机构的投资。 本轮融...
-
【保姆级教程】Linux上部署Stable Diffusion WebUI和LoRA训练,拥有你的专属图片生成模型
0 写在前面 Stable Diffusion 是当前最火热的图像生成模型之一,目前已经广泛应用于艺术创作、游戏开发、设计模拟等领域,因其开源生态和易于使用而受到创作者的广泛关注,相比 Midjourney 而言,其最大的优势是完全免费,且拥有庞大的社...
-
Adobe犯众怒!亡者镜头再启?售卖AI生成已故摄影大师风格图片引争议
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) Adobe最近遇到了麻烦,起因是已故摄影大师安塞尔·亚当斯的遗产管理方向公众谴责:该公司销售模仿亚当斯作品的生成式AI图像。 上周五,亚当斯的遗产管理方在Threads上发布了一张截图...
-
ChatGPT近8小时大规模宕机 平替谷歌Gemini 搜索量飙升60%
近日,全球数百万用户陷入困境,因为 OpenAI 的旗舰聊天机器人 ChatGPT 在美东时间4日下午出现系统故障,持续时间长达近8个小时。这一事件影响到了 ChatGPT 的所有用户,包括网站、APP 和桌面应用,让用户无法正常使用这一关键工具。 Cha...
-
【完整指南】如何在Visual Studio Code中轻松运行Llama 3模型?
Meta 发布了最新的开源语言模型Llama 3。因为它是开源的,你可以下载这个模型,并在自己的电脑上运行。 我清楚,你可能会想,在个人笔记本上运行一个拥有80亿参数的AI模型似乎只有技术高手才能做到。但别担心!这篇文章会提供一个简单的步骤指导,帮助每个...