语言模型第8页 - AIGC资讯

测试：ollama加载羊驼版本llama-3中文大模型

找了一个晚上各种模型，像极了当初找各种操作系统的镜像，雨林木风，深蓝、老毛桃…… 主要是官方的默认7B版本回答好多英文，而且回复的很慢，所以我是在ollama上搜索"chinese"找到了这个羊驼版本的， ollama run lgkt/llama3-...

生成式AI 2024-07-26 人工智能

1090阅读

百度、谷歌之后：微软也要在Bing搜索结果中加入AI摘要

快科技7月25日消息，据媒体报道，继百度、谷歌之后，微软也将在其搜索引擎Bing的搜索结果中引入AI摘要功能。 Bing生成搜索功能目前处于预览阶段，它通过AI技术为用户提供搜索查询的首选结果，并以原始响应的形式呈现。这些响应不仅包括简洁的答案概述，还通...

人工智能 2024-07-25 人工智能

865阅读

LlaMa 2

目录 LlaMa 2 介绍： Llama 的诞生： Llama 2 的训练数据集是如何构建和选择的？ Llama 2 在自然语言处理（NLP）任务中的具体应用案例有哪些？ Llama 2 模型在商业应用中的表现如何，有哪些成功案例？ Ll...

大数据 2024-07-25 人工智能

835阅读

AI日报：Bing推生成式AI搜索功能；Open-Sora Plan v1.2发布；Mistral Large2突然开源；腾讯智影推智能画布功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、Bing推生成式AI搜索功能...

生成式AI 2024-07-25 人工智能

962阅读

AI训AI惨遭投毒9次大崩溃，牛津剑桥等惊天发现登Nature封面！

9次迭代后，模型开始出现诡异乱码，直接原地崩溃!就在今天，牛津、剑桥等机构的一篇论文登上了Nature封面，称合成数据就像近亲繁殖，效果无异于投毒。有无破解之法?那就是——更多使用人类数据! 用AI生成的数据训练AI，模型会崩溃? 牛津、剑桥、帝国理工、多...

人工智能 2024-07-25 人工智能

1006阅读

AIGC从入门到实战：AIGC 赋能行业，产生无数新机会

AIGC从入门到实战：AIGC赋能行业，产生无数新机会 1. 背景介绍 1.1 问题的由来随着人工智能技术的飞速发展，尤其是生成式人工智能（Generative AI）的兴起，一个新的领域——AIGC（Artificial Intelligence...

人工智能 2024-07-25 人工智能

911阅读

【大语言模型LLMs】Llama系列简介

【大语言模型LLMs】Llama系列简介文章目录【大语言模型LLMs】Llama系列简介 1. LLaMa 1.1 引言 1.2 方法 1.2.1 预训练数据 1.2.2 架构 1.2.3 优化器 1.2.4 效率 2....

大数据 2024-07-24 人工智能

1323阅读

【大模型】微调实战—使用 ORPO 微调 Llama 3

ORPO 是一种新颖微调（fine-tuning）技术，它将传统的监督微调（supervised fine-tuning）和偏好对齐（preference alignment）阶段合并为一个过程。这减少了训练所需的计算资源和时间。此外，实证结果表明，ORP...

大数据 2024-07-24 人工智能

1209阅读

Llama 3.1有哪些功能免费吗？Meta AI最强大新模型怎么使用方法详细教程指南

Llama 3.1 是什么？ Llama 3. 1 是Meta AI推出的最新一代大型语言模型，具有128K的上下文长度扩展、支持八种语言，并首次开源了405B参数级别的前沿AI模型。该模型在通用知识、可控性、数学、工具使用和多语言翻译方面具有最先进的能力...

人工智能 2024-07-24 人工智能

1129阅读

Llama 3.1功能介绍及免费使用指南 Meta AI最新一代模型体验地址入口

Llama 3. 1 简介 Llama 3. 1 是Meta AI推出的最新一代大型语言模型，具有128K的上下文长度扩展、支持八种语言，并首次开源了405B参数级别的前沿AI模型。它为开发者和技术研究者提供了强大的支持，无论是需要处理大量文本数据的编程助...

人工智能 2024-07-24 人工智能

1302阅读

Llama-3.1-8B功能介绍及免费使用指南 Meta AI最新模型体验地址入口

Meta-Llama-3.1-8B简介 Meta-Llama-3.1-8B是一款多语言大型语言模型（LLMs），包含8B大小的版本，支持 8 种语言，专为多语言对话用例优化，并在行业基准测试中表现优异。它采用自回归语言模型，使用优化的Transformer...

大数据 2024-07-24 人工智能

1395阅读

一文看懂 LLaMA 2：原理与模型训练介绍

近年来，人工智能领域的进展使得自然语言处理（NLP）技术得到了显著提升。LLaMA 2 是一种先进的语言模型，它在处理语言生成和理解任务上表现出色。本文将介绍 LLaMA 2 的基本原理、模型结构以及训练方法，帮助你全面了解这一技术。 1. LLaMA...

大数据 2024-07-24 人工智能

1303阅读

AIGC 原理与代码实例讲解

AIGC 原理与代码实例讲解 1. 背景介绍 1.1 问题的由来随着人工智能技术的快速发展，生成式AI成为了科技界的一大热点。在众多生成技术中，AIGC（Artificial Intelligence for Generation and Crea...

大数据 2024-07-23 人工智能

1121阅读

使用LLaMA-Factory微调大模型

使用LLaMA-Factory微调大模型 github 地址https://github.com/hiyouga/LLaMA-Factory 搭建环境 git clone --depth 1 https://github.com/hiyouga/...

人工智能 2024-07-23 人工智能

1074阅读

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群，——还有各大厂商一直在卷的超长上下...

大数据 2024-07-23 人工智能

960阅读

2024-06-21 问AI: 在大语言模型中，什么是LLama Index

文心一言 LLama Index是一个针对基于LLM（大型语言模型）的应用程序的数据框架，旨在提供RAG（检索增强生成，Retrieval-Augmented Generation）能力。以下是关于LLama Index的清晰概述：定义与功能：...

AIGC 2024-07-23 人工智能

1319阅读

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了

Llama3.1终于现身了，不过出处却不是 Meta 官方。今日，Reddit 上新版 Llama 大模型泄露的消息遭到了疯传，除了基础模型，还包括8B、70B 和最大参数的405B 的基准测试结果。下图为 Llama3.1各版本与 OpenAI G...

生成式AI 2024-07-23 人工智能

835阅读

Llama也能做图像生成？文生图模型已开源

导读基于next-token prediction的图像生成方法首次在ImageNet benchmark超越了LDM, DiT等扩散模型，证明了最原始的自回归模型架构同样可以实现极具竞争力的图像生成性能。 Llama也能做图像生成？文生图模型已开源...

生成式AI 2024-07-23 人工智能

1420阅读

Llama 3模型：更自由、更强大的AI对话体验

引言人工智能领域正在经历一场革命，大型语言模型（LLM）的不断进步正在重塑我们与机器交互的方式。在这个快速发展的领域中，Meta公司推出的Llama系列模型一直备受关注。最新发布的Llama 3模型在多个方面都展现出了显著的进步，尤其是在减少不必要的...

人工智能 2024-07-22 人工智能

1086阅读

视频大语言模型调研论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》解读

本文是关于论文《Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding》的简要介绍。Video-LLaMA是阿里达摩院的一个多模态大语言模型...

大数据 2024-07-22 人工智能

1081阅读

AIGC领域综述

AIGC领域综述 2023 1. A Survey of Large Language Models 2. A Complete Survey on Generative AI (AIGC : Is ChatGPT from GPT-4 to...

生成式AI 2024-07-22 人工智能

1117阅读

AI日报：微软推设计神器Microsoft Designer；苹果开源小模型 DCLM-Baseline-7B；小爱宣布新增AI文档问答等功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、微软推设计神器Microsof...

AIGC 2024-07-22 人工智能

1013阅读

AIGC的行业发展

1. AIGC的行业发展 AIGC（Artificial Intelligence Generated Content，人工智能生成内容）是利用人工智能技术来自动生成内容的一种新型内容创作方式。它基于生成对抗网络(GAN 、大型预训练模型等技术，通过对已...

生成式AI 2024-07-22 人工智能

929阅读

llama.cpp

文章目录一、关于 llama.cpp 支持的模型： Multimodal models: Bindings: UI: Tools: 二、Demo 1、Typical run using LLaMA v2 13B on M2 Ultra...

大数据 2024-07-22 人工智能

1527阅读

[机器学习]-如何在 MacBook 上安装 LLama.cpp + LLM Model 运行环境

如何在 MacBook 上安装 LLama.cpp + LLM Model 运行环境 1. 问题与需求近段时间想学习一下大语言模型的本地化部署与应用。首先遇到的就是部署硬件环境的问题。我自己的笔记本是一台 MacBook Pro M3，没有 Nv...

AIGC 2024-07-21 人工智能

1397阅读

WPS辟谣用户文档被用作训练抖音豆包AI：完全失实严格遵守个人信息保护法规

快科技7月21日消息，日前，有网友发帖称，WPS疑似把我的审签内容喂给抖音豆包AI”，因为他的审签大纲细纲都是在WPS写的，上传了云空间。今天下午，WPS客户服务官微对此事进行了辟谣，称近日有部分用户反馈WPS AI相关问题，我们第一时间进行了严格排...

AIGC 2024-07-21 人工智能

919阅读

快速上手文心一言进行知识问答、文本创作、知识推理、数学计算、代码理解与编写、作画、翻译等多种任务

本人详解作者：王文峰，参加过 CSDN 2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的 Java 开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务...

AIGC 2024-07-21 人工智能

961阅读

Llama模型家族之拒绝抽样(Rejection Sampling)（九）强化学习之Rejection Sampling

LlaMA 3 系列博客基于 LlaMA 3 + LangGraph 在windows本地部署大模型（一）基于 LlaMA 3 + LangGraph 在windows本地部署大模型（二）基于 LlaMA 3 + LangGraph 在w...

大数据 2024-07-21 人工智能

1767阅读

给｢大模型初学者｣的 LLaMA 3 核心技术剖析

编者按：本文旨在带领读者深入了解 LLaMA 3 的核心技术 —— 使用 RMSNorm 进行预归一化、SwiGLU 激活函数、旋转编码（RoPE）和字节对编码（BPE）算法。RMSNorm 技术让模型能够识别文本中的重点，SwiGLU 激活函数则如同“...

生成式AI 2024-07-21 人工智能

1263阅读

欢迎 Llama 3：Meta 的新一代开源大语言模型_meta llama guard 2

介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本，现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋，我们也非常高兴地全力支持此次发布，并实现了与 Hugging Fac...

大数据 2024-07-20 人工智能

1341阅读

【AIGC调研系列】VILA-1.5版本的视频理解功能如何

VILA-1.5版本的视频理解功能表现出色，具有显著的突破。这一版本不仅增强了视频理解能力，还提供了四种不同规模的模型供用户选择，以适应不同的应用需求和计算资源限制[1][2][3]。此外，VILA-1.5支持在笔记本等边缘设备上部署，这得益于其高效的模型...

AIGC 2024-07-20 人工智能

1635阅读

甲骨文首次将LLMs引入数据库，集成Llama 3和Mistral，和数据库高效对话

信息时代，数据为王。数据库作为数据存储&管理的一种方式，正在以势不可挡的趋势与AI结合。前有OpenAI 收购了数据库初创公司 Rockset，引发广泛关注；Oracle公司（甲骨文）作为全球最大的信息管理软件及服务供应商，近日发布新产品Hea...

人工智能 2024-07-20 人工智能

877阅读

GPT-4o mini一手测评：懂得不多，但答得极快

昨晚，OpenAI 突然上线新模型 GPT-4o mini，声称要全面取代 GPT-3.5Turbo。在性能方面，GPT-4o mini 在 MMLU 上的得分为82%，在 LMSYS 排行榜的聊天方面分数优于 GPT-4。在价格方面，GPT-4o...

生成式AI 2024-07-20 人工智能

1442阅读

提示词用上“过去式“，秒破GPT4o等六大模型安全限制！中文语境也好使

只要在提示词中把时间设定成过去，就能轻松突破大模型的安全防线。而且对GPT-4o尤其有效，原本只有1%的攻击成功率直接飙到88%，几乎是“有求必应”。有网友看了后直言，这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文，揭开...

大数据 2024-07-20 人工智能

924阅读

LLaMA-Factory：开源的低代码大模型训练框架

LLaMA-Factory 是一个由零隙智能（SeamLessAI）开源的低代码大模型训练框架，它集成了业界最广泛使用的微调方法和优化技术，并支持众多开源模型的微调和二次训练。一、功能特点支持多种开源模型：LLaMA-Factory支持包括...

大数据 2024-07-20 人工智能

2423阅读

AI时代，有必要学AIGC大型模型部署实践课程嘛？适合那些人学习？有什么用？

在人工智能（AI）迅猛发展的今天，AIGC（Artificial Intelligence Generated Content，即基于人工智能的内容自动生成）已成为推动产业创新与发展的核心驱动力之一。随着ChatGPT、Claude等大型语言模型的兴起，掌...

大数据 2024-07-19 人工智能

1474阅读

GPT-4o mini背后团队揭秘：9人团华人面孔过半，清华北大同济校友在列

“大模型尺寸之争正在加速……倒退!” OpenAI的GPT-4o mini一登场，又登上了大模型话题榜榜首。并且这次话题焦点，是OpenAI不仅再树新标杆，还一出手就把性价比卷爆了——直接把此前大受开发者好评的Gemini1.5Flash和Claude3...

AIGC 2024-07-19 人工智能

948阅读

本地私有化部署开源大模型完整教程：LangChain + Streamlit+ Llama 【LLM大模型】

在过去的几个月里，大型语言模型(llm 获得了极大的关注，这些模型创造了令人兴奋的前景，特别是对于从事聊天机器人、个人助理和内容创作的开发人员。大型语言模型(llm 是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使...

生成式AI 2024-07-19 人工智能

1591阅读

（5-5-01）金融市场情绪分析：使用Llama 2 大模型实现财经信息的情感分析微调（1）

5.5 使用Llama 2 大模型实现财经信息的情感分析微调情感分析在金融和经济领域具有重要意义，可以帮助企业从市场洞察、风险管理和投资决策等方面获得有价值的信息。然而，在金融和经济文本方面的标注数据相对稀缺，因此需要使用自然语言处理技术和预训练模型...

人工智能 2024-07-19 人工智能

1527阅读

每日AIGC最新进展(46)：上海AI Lab发布多模态大模型InternLM-XComposer-2.5、阿里发布视频生成大模型EasyAnimate-V3、快手发布人像模型LivePortrait

Diffusion Models专栏文章汇总：入门与实战 InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input...

生成式AI 2024-07-19 人工智能

889阅读

Streaming local LLM with FastAPI, Llama.cpp and Langchain

题意：使用FastAPI、Llama.cpp和Langchain流式传输本地大型语言模型问题背景： I have setup FastAPI with Llama.cpp and Langchain. Now I want to enable...

大数据 2024-07-18 人工智能

990阅读

AIGC+教育专题：2024年AIGC+教育行业报告

今天分享的是AIGC+教育系列深度研究报告：《AIGC+教育专题：2024年AIGC+教育行业报告》。（报告出品方：艾瑞咨询）报告共计：58页宏观：AIGC带来的生产力革新 AIGC延伸扩展人脑智能，降低使用门槛，应用影响力无限泛化麦...

大数据 2024-07-18 人工智能

995阅读

AIGC各个应用场景下的模型选择

需要注意的是，下述模型可以在不同任务和领域中灵活应用，它们的归属也会根据模型的设计和主要应用领域而有所变化，并不绝对。自然语言处理模型模型层中自然语言理解(Natural LanguageUnderstanding，NLU 和自然语言生成(N...

生成式AI 2024-07-18 人工智能

1002阅读

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域 1. 背景介绍 1.1 问题的由来自然语言处理(Natural Language Processing, NLP 是人工智能(Artificial...

生成式AI 2024-07-18 人工智能

904阅读

Stable Diffusion秋叶AnimateDiff与TemporalKit插件冲突解决

文章目录 Stable Diffusion秋叶AnimateDiff与TemporalKit插件冲突解决描述错误描述：找不到模块imageio.v3 解决：参考地址其他文章推荐：专栏：人工智能基础知识点专栏：大语言模型LL...

生成式AI 2024-07-18 人工智能

1357阅读

AIGC实用场景-ChatBI架构设计

1. ChatBI概述 1.1 定义与背景 ChatBI是一种新兴的商业智能（BI）系统，它通过自然语言处理（NLP）技术，使得用户能够通过聊天的方式与数据进行交互。这种系统背后的理念是简化数据分析的复杂性，让非技术用户也能轻松地获取和分析数据。...

AIGC 2024-07-17 人工智能

2430阅读

使用llama.cpp量化模型

文章目录概要整体实验流程技术细节小结概要大模型量化是指在保持模型性能尽可能不变的情况下，通过减少模型参数的位数来降低模型的计算和存储成本。本次实验环境为魔搭社区提供的免费GPU环境（24G），使用Llama.cpp进行...

AIGC 2024-07-17 人工智能

1496阅读

AI日报：阿里云发布音频模型Qwen2-Audio；字节将推类sora模型；AI眼里13.11＞13.8

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Qwen2-Audio：千问系...

生成式AI 2024-07-17 人工智能

834阅读

AI搜索之战：谁在成为中国的Perplexity

又一个AI融资明星出现。当科技圈还在等待GPT5的发布，投资圈已经对一款大模型应用热情起来。目前，AI搜索引擎初创企业Perplexity正进行2.5亿美元的第四轮融资，此轮融资后，Perplexity的估值将达到30亿美元。而在今年1月，其估值还只有5...

AIGC 2024-07-17 人工智能

923阅读

绕晕了！9.11 大还是 9.9 大，难倒一批 AI 大模型？

「9.11和9.9，哪个大?」对于不少习惯了更新软件版本号的程序员而言，不少人的第一反应就是:当然是9.11大。但是如果没有限定场景，只是单纯地提出上面这个问题时，结果必然是相反的。没想到，将这个问题抛给前能答疑解惑、后能挑战各种高数难题的 AI 大模...

生成式AI 2024-07-17 人工智能

1185阅读