语言模型第9页 - AIGC资讯

麦当劳决定炒掉AI员工，用AI点餐这件事不靠谱

从游戏公司的画师到电销公司的客服，被AI影响到工作的人在2023年可谓是一茬接着一茬，甚至“第一批因AI而失业的人出现”更是成为了去年部分媒体最有兴趣的话题。事实上，AI技术的快速发展确实已经开始对人类社会造成影响，但过高估计当下AI的能力也大可不必，因为...

大数据 2024-07-17 人工智能

929阅读

“全网最全”LLM推理框架集结营 - 看似微不足道，却决定着AIGC项目的成本、效率与性能!

00-前序随着ChatGPT、GPT-4等大语言模型的出现，彻底点燃了国内外的学者们与企业家们研发LLM的热情。国内外的大语言模型如雨后春笋一般的出现，这些大语言模型有一部分是开源的，有一部分是闭源的。伴随着大语言模型的出现，国内外基于大语言模型...

大数据 2024-07-17 人工智能

2341阅读

山东大学项目实训（十六）:基于LLaMA-Factory的微调模型评估和测试

在LLaMA-Factory的Evaluate & Predict界面进行评测原始模型评测微调后模型评测可以看到，微调之后的模型在各个指标上有了显著提升在完成大型语言模型（如 ChatGLM）的微调后，对模型进行全面评估...

生成式AI 2024-07-16 人工智能

1821阅读

AI日报：Claude 3.5 Sonnet数据可视化超越GPT-4o；谷歌推AI视频剪辑Vids；首届AI小姐选美结果出炉

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、争气！Claude 3.5 S...

人工智能 2024-07-16 人工智能

914阅读

Llama模型家族之使用 Supervised Fine-Tuning（SFT）微调预训练Llama 3 语言模型（七）使用 LoRA 微调 LLM 的实用技巧

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

生成式AI 2024-07-16 人工智能

1497阅读

Qwen2——阿里巴巴最新的多语言模型挑战 Llama 3 等 SOTA

引言经过几个月的期待，阿里巴巴 Qwen 团队终于发布了 Qwen2 – 他们强大的语言模型系列的下一代发展。 Qwen2 代表了一次重大飞跃，拥有尖端的进步，有可能将其定位为 Meta 著名的最佳替代品骆驼3 模型。在本次技术深入探讨中，我...

AIGC 2024-07-16 人工智能

1461阅读

新研究：AI测谎能力比人类更强但需谨慎使用

快科技7月15日消息，据媒体报道，德国维尔茨堡大学当地时间12日公布的最新研究显示，在假新闻、政治家的可疑言论和被操纵的视频日益泛滥的时代，人工智能在测谎方面的表现比人类更佳。这项发表在《iScience》期刊上的研究，精心设计了一场实验：参与者被要求撰...

大数据 2024-07-15 人工智能

932阅读

文心一言、Kimi等4款AI大模型测评对比及推荐（AI大模型训练）

现在，国内已经有海量大模型诞生，那么，哪款大模型的表现会更好？这篇文章里，作者站在自媒体人的角度，对四款大模型做了评估和对比，一起来看一下。说到AI，很多人会想到ChatGPT，而我们现在也有许多好用的国产AI大模型。在2023年的中国，8个月...

大数据 2024-07-15 人工智能

1974阅读

LLama Factory微调模型全流程，与peft库调用训练的adapter

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录 LLama Factory微调流程一、准备微调的数据集和模型二、读取模型和数据进行训练 1.使用web ui 2.修改官方脚本（推荐）第三，加载与推...

人工智能 2024-07-15 人工智能

1370阅读

【AIGC调研系列】InternVL开源多模态模型与GPT-4V的性能对比

InternVL和GPT-4V都是多模态模型，但它们在性能、参数量以及应用领域上有所不同。 InternVL是一个开源的多模态模型，其参数量为60亿，覆盖了图像/视频分类、检索等关键任务，并在32个视觉-语言基准测试中展现了卓越性能[2]。InternV...

大数据 2024-07-15 人工智能

1671阅读

【人工智能】一文看懂 LLaMA 2：原理、模型与训练

LLaMA 2（Large Language Model for AI Modeling and Assistance）是近年来广受关注的大规模语言模型之一。它被广泛应用于自然语言处理（NLP）任务，如文本生成、机器翻译和问答系统。本文将深入介绍LLaMA...

大数据 2024-07-15 人工智能

1054阅读

Fastgpt接入Whisper本地模型实现语音输入

前言 FastGPT 默认使用了 OpenAI 的 LLM 模型和语音识别模型，如果想要私有化部署的话，可以使用openai 开源模型Whisper。参考文章《openai 开源模型Whisper语音转文本模型下载使用》开源项目地址：兼容op...

人工智能 2024-07-15 人工智能

1969阅读

Llama 3 基于知识库应用实践（一）

一、概述 Llama 3 是Meta最新推出的开源大语言模型，其8B和13B参数的模型的性能与之前的Llama 2相比实现了质的飞跃。以下是官方给出的模型性能评测对比结果（引自：https://ai.meta.com/blog/meta-llama-3/...

生成式AI 2024-07-14 人工智能

919阅读

从头开始学习扩散模型 Stable Diffusion

今天我们来揭开 Stable Diffusion 技术的神秘面纱。 1.稳定扩散原理 Stable Diffusion 在2022年发表，一种基于Latent Diffusion Models的新兴机器学习技术。它基于扩...

AIGC 2024-07-14 人工智能

863阅读

近屿OJAC带你解读：AIGC核心知识点LLM

近年来，人工智能（AI）领域经历了令人瞩目的增长，尤其是自然语言处理（NLP）。你知道是什么推动了NLP领域的这种飞速发展吗？没错，那就是大型语言模型LLM。这些模型可能会彻底改变我们与科技的互动方式！这些模型是如何工作的呢？它们为何如此流行？在本文中...

生成式AI 2024-07-14 人工智能

891阅读

百度智能云升级：接入33个大模型，Llama 2引领创新，103个Prompt模板上线

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业...

生成式AI 2024-07-14 人工智能

910阅读

突破AI性能瓶颈揭秘LLaMA-MoE模型的高效分配策略

获取本文论文原文PDF，请在公众号【AI论文解读】留言：论文解读本文介绍了一种名为“LLaMA-MoE”的方法，通过将现有的大型语言模型（LLMs）转化为混合专家网络（MoE），从而解决了训练MoE时遇到的数据饥饿和不稳定性问题。该方法基于著名的LLa...

AIGC 2024-07-13 人工智能

973阅读

聚观早报 | 理想L6正式发布；Meta发布Llama 3

聚观早报每日整理最值得关注的行业重点事件，帮助大家及时了解最新行业动态，每日读报，就读聚观365资讯简报。整理丨Cutie 4月20日消息理想L6正式发布 Meta发布Llama 3 比亚迪秦L内饰曝光小米14 Ultra推送新版澎湃...

人工智能 2024-07-13 人工智能

817阅读

AIGC从入门到实战：ChatGPT 说自己能做什么？

背景介绍随着人工智能技术的不断发展，自然语言处理（NLP）技术也取得了显著的进展。近年来，生成对抗网络（GAN）和序列模型（Seq2Seq）等技术的发展，使得机器学习和深度学习在语言模型方面取得了突破性进展。其中，OpenAI的ChatGPT模型是目前...

AIGC 2024-07-13 人工智能

835阅读

规格拉满！Llama和Sora作者都来刷脸的中国AI春晚，还开源了一大堆大模型成果...

鱼羊明敏发自凹非寺量子位 | 公众号 QbitAI 本周国内最受关注的AI盛事，今日启幕。活动规格之高，没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流，李开复与...

AIGC 2024-07-13 人工智能

924阅读

快速上手文心一言指令

文心一言是百度推出的基于深度学习技术的大型语言模型，能够进行智能问答、文本生成、翻译、情感分析等多种语言任务。要快速上手文心一言指令，可以参考以下步骤：注册与登录：首先需要访问文心一言的官方网站或应用商店，下载并安装应用。完成注册和登录后，你就...

大数据 2024-07-13 人工智能

1086阅读

Llama 3 与 GPT-4：哪个更好？

Llama 3 和 GPT-4 是目前公开可用的两种最先进的大型语言模型（LLM）。让我们通过比较这两个模型的多模态性、上下文长度、性能和成本，来看看哪个 LLM 更好。什么是 GPT-4？ GPT-4 是 OpenAI 开发的最新大型语言模型（...

生成式AI 2024-07-12 人工智能

1351阅读

高质量AIGC/ChatGPT/大模型资料分享

2023年要说科技圈什么最火爆，一定是ChatGPT、AIGC（人工智能生成内容）和大型语言模型。这些技术前沿如同科技世界的新潮流，巨浪拍岸，引发各界关注。ChatGPT的互动性和逼真度让人们瞠目，它能与用户展开流畅对话，回答问题，乃至创作文章和诗歌，展现...

大数据 2024-07-12 人工智能

992阅读

AI日报：Claude 3 Haiku支持微调；Heygen推对口型工具；百度称萝卜快跑安全水平接近C919飞机

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Anthropic宣布Clau...

大数据 2024-07-12 人工智能

918阅读

谁才是大模型“四小龙”？

这两年热闹的大模型创业潮，被业内称为“AI2.0”。与之对应的“AI1.0”，指的是2015年左右开始的那一波AI创业潮，当时诞生了商汤、旷视、云从、依图等明星创业公司，它们以CV技术（计算机视觉）为主导，大量融资，风头无两。这四家公司，是公认的“AI四...

大数据 2024-07-12 人工智能

897阅读

如何使用通义千问整理、分析、提取数据，提升办公效率

在数字化时代，数据的重要性不言而喻。无论是企业还是个人，都面临着海量数据的挑战。如何有效地整理、分析和提取数据，成为提升办公效率的关键。本文将介绍如何利用通义千问这一工具，帮助您在办公过程中实现数据的高效管理。一、通义千问简介通义千问，由阿里云开发...

大数据 2024-07-12 人工智能

1831阅读

NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM的原理和差异有哪些-详细解读

自然语言处理（NLP）领域的多个大型语言模型（如GPT-3、ChatGPT、T5、PaLM、LLaMA和GLM）在结构和功能上有显著差异。以下是对这些模型的原理和差异的深入分析： GPT-3 (Generative Pre-trained Transf...

AIGC 2024-07-12 人工智能

1467阅读

在stable diffusion中如何分辨lora、大模型、controlnet

LoRA (LowRank Adaptation Stable Diffusion LoRA 是微软的研究人员为了解决大语言模型微调而开发的一项技术,它是一个多模态语言-图像模型，LORA 可以学习将其语言表征迁移到图像 modal 中从而获得跨模态...

人工智能 2024-07-11 人工智能

976阅读

实现 LLM 应用的可观测，难在哪里？

随着生成式 AI 概念的火爆，以 ChatGPT、通义大模型为代表，市场上涌现了一系列商用或者开源的大模型，同时基于大语言模型（LLM ）以及 AI 生态技术栈构建的应用以及业务场景也越来越多。众所周知，LLM 包含数十亿甚至万亿级别的参数，其架构复杂...

人工智能 2024-07-11 人工智能

1132阅读

【AIGC半月报】AIGC大模型启元：2024.06（下）

AIGC大模型启元：2024.06（下） (1 Gen-3 (2 Open-Sora 1.2（Open-Sora再升级） (3 Claude 3.5 Sonnet（Claude升级） (4 ChatTTS v3（ChatTTS升级） (...

AIGC 2024-07-11 人工智能

951阅读

AI自学超越人工标注训练，蚂蚁数科2篇自监督学习论文入选国际顶会

近日，蚂蚁数科2项研究成果分别入选“欧洲计算机视觉会议（ECCV）”和“国际机器学习大会(ICML ”，可实现无需人工打标数据的情况下，通过自监督学习、强化学习等方法训练模型输出可信结果。据悉，两项成果将被应用于视频版权保护和智能问答领域。作为人工智能领域...

AIGC 2024-07-11 人工智能

970阅读

快速LLaMA：面向大型语言模型的查询感知推理加速论文摘要翻译与评论

论文摘要翻译与评论论文标题： QuickLLaMA: Query-aware Inference Acceleration for Large Language Models 提出的框架我们Q-LLM框架的示意图。来自记忆上下文的输入被...

AIGC 2024-07-11 人工智能

954阅读

《AI聊天类工具之五——Copilot》

一.简介官网：Microsoft Copilot: 你的日常 AI 助手 Copilot是微软在Windows 11操作系统中引入的一款先进的AI助手。这款工具集成在操作系统的侧边栏中，旨在帮助用户完成各种任务。它依托于底层大语言模型（LLM），...

大数据 2024-07-11 人工智能

1153阅读

力图缩小与NVIDIA差距！AMD豪掷6.65亿美元现金收购Silo AI

快科技7月11日消息，AMD近日宣布，将以6.65亿美元的全现金方式收购芬兰人工智能初创公司Silo AI，力图缩小与行业领导者NVIDIA的差距。 Silo AI作为欧洲最大的私人AI实验室之一，专注于为企业提供定制化的AI模型和平台。此次收购将使AM...

大数据 2024-07-11 人工智能

974阅读

大模型真的在吞噬人类的一切数据吗？

在弗兰克·赫伯特的《沙丘》中，沙漠星球厄拉科斯的沙丘下隐藏着一种无价之宝:香料。这种神秘物质使太空旅行成为可能，能延长寿命，并具有扩展意识的效果，是宇宙中最宝贵的财富。“谁控制了香料，谁就控制了宇宙”。正如香料在《沙丘》宇宙中占据着至关重要的地位一样，在...

AIGC 2024-07-11 人工智能

901阅读

一文看懂LLaMA 2：原理、模型与训练

引言人工智能领域的快速发展，带来了许多强大的语言模型。LLaMA 2 是其中之一，以其出色的性能和灵活的应用能力，吸引了广泛关注。这篇文章将带你深入了解 LLaMA 2 的原理、模型架构和训练过程，帮助你全面掌握这一前沿技术。什么是LLaMA...

AIGC 2024-07-10 人工智能

1250阅读

LLaMA-Adapter：零初始注意机制的语言模型高效微调

23年6月来自上海AI实验室，香港中文大学和UCLA的论文“LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention“。 LLaMA-Adapter是...

生成式AI 2024-07-10 人工智能

1209阅读

AIGC内容分享(一)：一次性搞懂什么是AIGC

目录前言一、基本概念/理论 1、AI 2、AI大模型 3、开源 4、自然语言处理（NLP） 5、AIGC 6、AIGC和Chat GPT的关系 7、AIGC可以生成的内容二、常见的AIGC应用（一）常用AIGC软件（二）A...

AIGC 2024-07-10 人工智能

1200阅读

【Qwen2部署实战】llama.cpp：一键部署高效运行Qwen2-7B模型

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

大数据 2024-07-10 人工智能

1494阅读

文心一言对GPT-4o的评价与分析

在人工智能的浪潮中，大型语言模型（LLM）的发展日新月异，为自然语言处理（NLP）领域带来了诸多突破。GPT系列模型作为其中的佼佼者，其每一次更新都牵动着业界的目光。近日，GPT-4o的发布更是引发了广泛的讨论。本文将从文心一言的视角出发，对GPT-4o进...

大数据 2024-07-10 人工智能

834阅读

AIGC革新浪潮：大语言模型如何优化企业运营

在当今快速发展的商业环境中，企业对于有效管理知识资产的需求日益增长。知识管理作为企业核心竞争力的关键组成部分，对于提高决策质量、增强创新能力和优化运营流程起着至关重要的作用。随着数字化转型的推进，企业对知识管理系统提出了新的要求，期望其能够更加智能化、高效...

人工智能 2024-07-10 人工智能

994阅读

Meta Llama 3 来啦！性能算力究竟如何？

新一代大语言模型 Meta Llama 3 横空出世！前言就在4月19日，Meta公司推出了他们最新开源的大型语言模型(LLM Llama 3！这次的Llama 3包含了8B和70B两种不同参数规模的模型。那么作为Llama的第三代模型它...

大数据 2024-07-09 人工智能

898阅读

RAG微调Llama 3竟超越GPT-4！英伟达GaTech华人学者提出RankRAG框架

【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架，简化了原本需要多个模型的复杂的RAG流水线，用微调的方法交给同一个LLM完成，结果同时实现了模型在RAG任务上的性能提升。在需要大量事实知识的文本生成任务中，R...

AIGC 2024-07-09 人工智能

1463阅读

【AIGC 概念理解】Zero-Shot，One-Shot，Few-Shot，In-Context Learning，Tuning-Free/Training-Free/Inference-Only

在人工智能领域，特别是自然语言处理（NLP）和机器学习中，几个重要的概念正在推动研究和应用的前沿发展。以下是few-shot learning, zero-shot learning, in-context learning, tuning-free, t...

大数据 2024-07-09 人工智能

1244阅读

14-31 剑和诗人5 - 使用 AirLLM 和分层推理在单个 4GB GPU 上运行 LLama 3 70B

利用分层推理实现大模型语言(LLM 大型语言模型 (LLM 领域最近取得了显著进展，LLaMa 3 70B 等模型突破了之前认为可能实现的极限。然而，这些模型的庞大规模给其部署和实际使用带来了巨大挑战，尤其是在资源受限的设备上，例如内存有限的 GPU...

AIGC 2024-07-09 人工智能

1300阅读

【大语言模型LLM】- Meta开源推出的新一代大语言模型 Llama 3

?博客主页：西瓜WiFi ?系列专栏：《大语言模型》很多非常有趣的模型，值得收藏，满足大家的收集癖！如果觉得有用，请三连?⭐❤️，谢谢！长期不定时更新，欢迎watch和fork！❤️❤️❤️ ❤️感谢大家点赞? 收藏⭐ 评论⭐ ?大语言模...

大数据 2024-07-08 人工智能

862阅读

如何快速接入llama 3 ？送上最便捷教程

一、Meta llama 3介绍当地时间4月18日，Meta 发布两款开源Llama 3 8B与Llama 3 70B模型。按照Meta的说法，Llama 3 8B和Llama 3 70B是目前同体量下，性能最好的开源模型。在Llama...

大数据 2024-07-08 人工智能

980阅读

万字长文解析AI Agent技术原理和应用

本文分享自华为云社区《AI Agent框架（LLM Agent）：LLM驱动的智能体如何引领行业变革，应用探索与未来展望》，作者：汀丶。 1. AI Agent（LLM Agent）介绍 1.1. 术语 Agent：“代理” 通常是指有意...

AIGC 2024-07-08 人工智能

1431阅读

推荐开源项目：Purple Llama - 开放式生成AI的负责任构建工具集合

推荐开源项目：Purple Llama - 开放式生成AI的负责任构建工具集合 Purple Llama 是一个综合性的项目，旨在通过提供工具和评估方法，帮助社区在开放的生成人工智能模型上进行负责任的开发。这个项目不仅关注技术的可能性，更重视安全性和...

生成式AI 2024-07-08 人工智能

1150阅读

AI日报：快手上线可灵网页端并开源可图Kolors；达摩院AI视频平台“寻光”炸场；月之暗面推Kimi浏览器插件

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、可灵AI又放大招：上线Web端...

大数据 2024-07-08 人工智能

1002阅读