-
Chinese-Vicuna: 一个基于LLaMA的中文指令跟随模型
Chinese-Vicuna简介 Chinese-Vicuna是一个基于LLaMA的中文指令跟随模型,由研究者开发,旨在以低资源的方式实现高效的中文语言模型训练。该项目的主要目标是构建和分享可以在单个Nvidia RTX-2080TI上训练的中文指令跟随...
-
调用大模型API-文心一言
一、准备工作 进入百度智能云千帆大模型平台,点击应用接入-创建应用;按提默认完成创建 二、开始使用 单轮调用 进入API列表 - ModelBuilder以第一个ERNIE-4.0-8K为例,选择“HTTP请求调用”,把第一步创建应用的 应用A...
-
AIGC文本生成
文本生成是一种人工智能技术,它基于深度学习算法,根据给定的提示信息创作出有逻辑、连贯的文本内容。 文本生成所需的输入(提示或Prompt)可以是简单的关键词、一句话概述或是更复杂的指令和上下文信息。文本生成模型通过分析大量现有数据,学习语言模式,广泛应用...
-
AI写作保姆级方法论第六节-AI的终极调教心法(问题+解决方案)
效果是什么 大象基于大量的实战经验,总结出了AI prompt调教的终极杀手锏:【终极调教心法:1个原则和3个技巧】 一个原则,是指AI的【角色扮演法】,openai官方基于AI原理给出的让AI听话的技巧。所有AI的使用玩法,都跑不出角色扮演,...
-
Meta开源的Llama官方Agent:Llama-Agentic-System深度解析
TLDR • Meta 推出的 Llama as a System 将 Llama 3.1 模型转变为一个能够自主完成任务的智能代理,通过多步推理、工具使用和系统级安全机制,为构建更智能、更安全的 AI 应用开辟了新的可能性。 • Llama-A...
-
源码解析LLaMA-Factory/src/llmtuner/data/template.py + Qwen模板
@dataclass class Template: format_user: "Formatter" format_assistant: "Formatter" format_system: "Formatter" for...
-
Mistral联合英伟达开源12B小模型:碾压Llama 3,单张4090可跑
小模型,成为本周的AI爆点。 与动辄上千亿参数的大模型相比,小模型的优势是显而易见的:它们不仅计算成本更低,训练和部署也更为便捷,可以满足计算资源受限、数据安全级别较高的各类场景。因此,在大笔投入大模型训练之余,像 OpenAI、谷歌等科技巨头也在积极训...
-
7 大国产大模型:KimiChat、豆包、文心一言、智谱清言、通义千问、讯飞星火、天工AI,到底哪家强?
有的朋友还不了解 AI 工具,或者跟老王一样,不知道该选哪个 AI 工具。 怎么办?先看看别人都用哪个。 新榜(著名三方自媒体数据平台),根据各自媒体平台的数据,统计了 AI 产品的用户使用等多个维度,分析得出了综合评分,展示如下。 第 3 和...
-
AI风险管理新利器:SAIF CHECK利用Meta Llama 3保障合规与安全
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同...
-
探索法律智能的新高度:Lawyer LLaMA 项目深度解析
探索法律智能的新高度:Lawyer LLaMA 项目深度解析 lawyer-llama中文法律LLaMA (LLaMA for Chinese legel domain 项目地址:https://gitcode.com/gh_mirrors/la/la...
-
Anthropic工程师分享沉浸式体验,和「AI搭子」Claude共度完美一天
【新智元导读】沉浸式体验Anthropic提示词工程师与「完美拍档」Claude共度的一天! AI聊天机器人只能用来写文案和找资料? 那说明你对AI工具的开发还不到1%! 昨天,Anthropic工程师Alex Albert,在X上分享了他如何与「AI搭子...
-
快速上手文心一言
在日常工作和学习中,人工智能的应用越来越广泛。文心一言是百度推出的一款人工智能大语言模型产品,它可以根据上一句话预测生成下一段话,帮助我们获取信息、知识和灵感。以下是对文心一言的介绍和使用方法。 一、什么是文心一言 文心...
-
崔大宝:大模型降温背后的难点、卡点、节点
进入2024年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发“泡沫戳破”的担忧; 消费市场,BATH们的推新活动少了,产品更新迭代的速度慢了,民众的关注度降了…… 热闹的大概只剩下两场酣仗:自5月15日字节跳动宣布“...
-
探索中文智能的未来:Chinese-LLaMA-Alpaca-3 项目深度解析
探索中文智能的未来:Chinese-LLaMA-Alpaca-3 项目深度解析 Chinese-LLaMA-Alpacaymcui/Chinese-LLaMA-Alpaca 是一个基于 LLaMA 的中文自然语言处理模型。适合在自然语言处理、机器学习和...
-
springboot 项目整合 AI (文心一言)
百度智能云网址:https://cloud.baidu.com/?from=console 注册——个人认证——登录成功 第一步:点击千帆大模型平台 第二步:点击应用接入——创建应用 第三步:点击接口文档——API列表——可以点击指定模...
-
AI多模态实战教程:面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理
一、项目简介 MiniCPM-V 系列是专为视觉-语⾔理解设计的多模态⼤型语⾔模型(MLLMs),提供⾼质量的⽂本输出,已发布4个版本。 1.1 主要模型及特性 (1)MiniCPM-Llama3-V 2.5: 参数规模: 8B 性能: 超越...
-
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。 LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段。 后者不仅依赖昂贵的人工标...
-
大数据最新大模型学习路线与建议_大模型学习路径
1 既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化! 由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后...
-
微软 Phi-3.1 Mini (3.8B):刚刚进行了疯狂升级(击败 Llama-3 和 Qwen2)
微软 Phi-3.1 Mini (3.8B :刚刚进行了疯狂升级(击败 Llama-3 和 Qwen2) 原创 Aitrainee AI进修生 2024年07月06日 15:16 湖南 Aitrainee | 公众号:AI进修生 🌟这...
-
AIGC实用场景-ChatBI架构设计
1. ChatBI概述 1.1 定义与背景 ChatBI是一种新兴的商业智能(BI)系统,它通过自然语言处理(NLP)技术,使得用户能够通过聊天的方式与数据进行交互。这种系统背后的理念是简化数据分析的复杂性,让非技术用户也能轻松地获取和分析数据。...
-
探索开源宝藏:LLaMA 2 模型的全面优势与实践指南
探索开源宝藏:LLaMA 2 模型的全面优势与实践指南 引言 在大型语言模型(LLM)的领域中,Meta AI 开发的 LLaMA 2 以其开源的优势和强大的性能,迅速成为研究和开发社区的新宠。本文将深入探讨 LLaMA 2 的优势,并提供详细的实...
-
当高考志愿填报成为一门生意,AI将扮演怎样的角色?
“瞎填志愿一时爽,毕业工作火葬场。” 这句话虽然是个段子,但却指出了高考志愿填报的重要性。某种程度上,志愿填报看似只是勾选几个大学的名字,实则是在为人生选择方向,没有人愿意错付四年的青春。 实施新高考改革后,考生们看似有了更多的自主选择权,比如有的省份最多...
-
提示词工程入门-使用文心一言4.0-通义千问-GPT4-Claude3通用提示技巧测试
提示词工程基础🚀 在了解完了大语模型的基本知识,例如API的使用多轮对话,流式输出,微调,知识向量库等知识之后,接下来需要进一步补足的一个大块就是提示词工程,学习和了解提示词工程除了基本的提示词类型之外,不同的大模型对于提示词工程润色之后...
-
LLaMA-Factory微调多模态大语言模型教程
本文旨在结合笔者自身的实践经历,详细介绍如何使用 LLaMA-Factory 来微调多模态大语言模型。目前仓库已支持若干流行的MLLM比如LLaVA-1.5,Yi-VL,Paligemma等。 2024.5.29 注:本文后续不再更新,如果想了解更新的特...
-
百度文心一言API4.0 Python调用ERNIE-4.0-8K详细教程
ERNIE 4.0是百度自研的旗舰级超大规模⼤语⾔模型,相较ERNIE 3.5实现了模型能力全面升级,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效,支持5K tokens输入+2K tokens输出。ERNIE-4.0-8K是模...
-
基于阿里云PAI部署LLaMA Factory 完成Llama3低代码微调和部署
一、引言 阿里云人工智能平台 PAI 提供了面向开发者与企业的深度学习工程平台,其中交互 式建模 PAI-DSW 集成了 Jupyter 等多种云端开发环境,提供丰富的计算资源与镜像环 境,实现开箱即用的高效开发模式。LLaMA Factory 则是一款...
-
马斯克的Grok已经可以在xAI网站上单独访问
马斯克开发的Grok现在已经可以在xAI网站上单独访问。这个工具在xAI平台上的功能比之前在推特上展示的版本更加丰富。特别值得一提的是它的分支树模式,这个模式允许用户观察多轮对话中可能产生的不同回答路径,这对于分析和理解对话流程非常有用。 如果你对使用Gr...
-
OpenAI把GPT-4原始版给了他们:研究不微调只靠提示词能走多远
除了OpenAI自己,居然还有别人能用上GPT-4-Base版?? 也就是未经微调的预训练版,还不会对话聊天,只会补全句子的模型。 EPFL(瑞士洛桑联邦理工)团队申请到了访问权限,用于研究“上下文学习足以让大模型跟随指令吗?”。 也就是不用监督微调、...
-
微信公众号来到AI推荐时代
作为有能力打通整个腾讯内容生态的大模型产品,腾讯元宝的低调出手,已然在行业内引起广泛关注。 5月30日,腾讯混元大模型首个App“腾讯元宝”正式上线,定位为面向C端用户的全能AI助手,目前已登陆各大主流官方应用商店,网页端和小程序端也可以同步体验。 腾讯...
-
百度文心一言api Python调用ERNIE-Lite-8K-0922具体教程
ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。ERNIE-Lite-8K-0922(原ERNIE-Bot-turbo-0922)是模型的一个模版,本文介绍了相关API及应用。 创建chat...
-
彻底火了!《AIGC 面试宝典》圈粉无数!
2022 年下半年以来,文本生成图像快速出圈,多款应用持续火爆。 国外文生图代表:Midjourney、Stable Diffusion、OpenAI 的 DALL-E: 海外模型SD开源,进一步促进了国内大厂的研究热情和应用落地: 随着多模态技术迭...
-
真实对比kimi、通义千问、文心一言的写代码能力,到底谁强?
🤖AI改变生活:最近都在说月之暗面的kimi的各项能力吊打国内其他大模型,今天我们真实感受下 kimi、通义千问、文心一言的根据需求写代码的能力。 测评结果让人震惊! kimi kimi编程过程 我们先看一下热捧的月之暗面的kimi模型。...
-
百度文心一言api Python调用ERNIE-Speed-8K具体方法
ERNIE Speed是百度2024年最新发布的自研高性能大语言模型,通用能力优异,适合作为基座模型进行精调,更好地处理特定场景问题,同时具备极佳的推理性能。ERNIE-Speed-8K是模型的一个版本,本文介绍了相关API。 创建chat 调用本接口...
-
讯飞星火等10个生成式AI平台对比分析 附网址 全部免费 [ 讯飞星火、智谱清言、天工 AI、Kimi AI、通义千问、文心一言、腾讯混元、豆包 AI、海螺 AI、360智脑 ]
目录 人工智能技术概览 AI平台优劣势对比 讯飞星火 智谱清言 天工AI Kimi AI 通义千问 文心一言 腾讯混元 豆包AI 海螺AI 360智脑 部分AI生成的图片 模型测评评分 综合评分(人类裁判)...
-
长文干货!老程序员测评文心一言4.0模型代码能力!
目录 前言:老程序员聊聊AI和国产大模型 第一关:代码质量和可用性——写个可运行的游戏代码 第二关:需求理解和记忆能力——多轮对话下的任务能力 总结 前言:老程序员聊聊AI和国产大模型 大家好,我是一名老程序员了,大模型出来后我算是一...
-
“问答爬虫”技术揭秘:智能信息检索的未来
在互联网时代,信息获取已经成为人们日常生活中不可或缺的一部分。随着互联网技术的不断发展和数据量的急剧增长,如何高效、准确地从海量信息中筛选出有价值的信息,成为了亟待解决的问题。在这样的背景下,“问答爬虫”技术应运而生,它凭借其智能化、精准化的特点,正在逐步...
-
腾讯混元将发布大模型C端App腾讯元宝:超万亿参数规模
在腾讯云生成式AI产业应用峰会上,腾讯表示,将于5月30日正式发布面向C端的全新App——“腾讯元宝”。这款应用的背后,是腾讯全链路自研的通用大语言模型——混元大模型,它以其超过万亿的参数规模,展现了卓越的中文理解与创作能力、逻辑推理能力以及可靠的任务执行...
-
首个中文原生DiT架构!腾讯混元文生图大模型全面开源,免费商用
中文 AI 社区迎来了一个好消息:与 Sora 同架构的开源文生图大模型来了! 5 月 14 日,腾讯宣布旗下混元文生图大模型全面升级并全面开源,目前已在 Hugging Face 平台及 GitHub 上发布,包含模型权重、推理代码、模型算法等完整模型...
-
腾讯混元文生图大模型宣布开源:首个中文原生DiT架构
今日,腾讯旗下引人注目的混元文生图大模型(混元DiT)宣布全面开源,这一重要举措标志着人工智能领域的又一里程碑。该模型已在Hugging Face和Github平台上发布,包含完整的模型权重、推理代码和算法,面向全球的企业与个人开发者免费开放商用。 腾讯混...
-
微调和量化竟会增加越狱风险!Mistral、Llama等无一幸免
大模型又又又被曝出安全问题! 近日,来自Enkrypt AI的研究人员发表了令人震惊的研究成果:量化和微调竟然也能降低大模型的安全性! 论文地址:https://arxiv.org/pdf/2404.04392.pdf 在作者的实际测试中,Mistra...
-
专利大模型的实践与知识问答探索
一、专利大模型背景介绍 智慧芽一直致力于为科技创新和知识产权领域提供信息服务。在小型模型时代(如 Bert),参数量较少,智能理解方面存在局限性。因此,在着手开发大模型之前,智慧芽深入思考了领域聚焦的重要性。在知识产权领域,专利检索、专利对比、标引工作...
-
神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜
一夜之间,大模型话题王,再次易主。 一个神秘模型突然杀入众人视野,能力超越一众开源模型,甚至包括GPT-4。几乎所有人都在谈论它,服务器都被挤爆了。 它就是“gpt2-chatbot”。 (注意啊,是gpt2不是GPT-2) 它有多强? IMO国际数学...
-
Cohere发布Toolkit AI工具包 一个专为企业定制的知识助手
Cohere 近期发布了其 Toolkit AI 工具包,该工具包的初始应用程序是一个专为企业定制的知识助手。这款知识助手能够连接企业数据,为特定团队提供定制化服务,通过快速访问信息和自动化任务来提升工作效率。 主要特点: 会话式交互: Cohere 的...
-
支付宝悄悄上线智能助理,我们也偷偷测了下
支付宝被曝推出了新的AI产品! 量子位了解到,支付宝对一款AI智能助理进行灰度测试。 这款AI产品入口,就在支付宝最核心的首页位置,但又隐藏得较深。 如果你有幸被灰度到,那么点击首页右上角的加号时会看到“智能助理”的按钮。 不过,支付宝智能助理不同于对...
-
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可参看机器之心当时的报道《全网大讨论:引爆 OpenAI 全员乱斗的 Q * 到底是什么?》简而言之,Q* 很可能是...
-
借势大模型,科大讯飞走出低谷了吗?
AI1.0公司想靠大模型打个漂亮的“翻身仗”,似乎还差一口气。 4月23日,科大讯飞发布2023年年度及2024年Q1业绩报告。全面 All in大模型的一年,科大讯飞交出了首份成绩单,2023年营业收入为196.5亿元,同比增长4.41%;归属于上市公司...
-
来自Anthropic:如何衡量大语言模型的说服力?
尽管人们长期以来一直在质疑AI模型是否会在某些时候变得像人类一样具有说服力,从而改变人们的想法,但在模型规模与输出说服力程度之间的关系方面,实证研究一直有限。为了解决这个问题,研究人员开发了一种基本方法来衡量说服力,并将其用于比较三个不同世代(Clau...
-
神仙掐架!24届视觉算法岗(AIGC方向)秋招经验分享!
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 今天我来介绍我们星球社群一位很...
-
80M参数打平GPT-4!苹果发超强上下文理解模型ReALM,聪明版Siri马上就来
【新智元导读】苹果公司发布了一款参数量仅为80M的最新模型——ReALM,能够将各种形式的上下文转换为文本进行理解,包括解析屏幕、多轮对话以及上下文引用,提升了Siri等智能助手的反应速度和智能程度。 会读心的Siri想不想要? 今天,苹果发布了自家的最新...
-
游戏NPC“活”了,英伟达AI立大功
智能NPC,已经承担起推动游戏主线的任务了! 育碧的一个DEMO中,两名个性鲜明的智能NPC带着玩家,在游戏世界中畅游了十五分钟。 不仅对话过程流畅、表情动作自然,而且还最新支持了多轮对话。 最关键的是,与NPC的对话不再只是闲聊,而是时时刻刻在推进主...