人工智能第125页

详解AI作画原理：从生成对抗网络到卷积神经网络

人工智能（AI）作画是近年来备受瞩目的领域之一，它不仅为艺术创作带来了全新的可能性，也推动了计算机视觉和深度学习技术的发展。本文将深入探讨AI作画的原理，重点介绍生成对抗网络（GAN）和卷积神经网络（CNN）在作画中的应用，并探讨它们的工作原理以及在实际应...

生成式AI 2024-05-30 人工智能

1068阅读

whisper之初步使用记录

文章目录前言一、whisper是什么？二、使用步骤 1.安装 2.python调用 3.识别效果评估 4.一点封装 5.参考链接总结前言随着AI大模型的不断发展，语音识别等周边内容也再次引发关注，通过语音转文字再与大模...

人工智能 2024-05-30 人工智能

1180阅读

【AI工具】GitHub Copilot IDEA安装与使用

GitHub Copilot是一款AI编程助手，它可以帮助开发者编写代码，提供代码建议和自动完成功能。以下是GitHub Copilot在IDEA中的安装和使用步骤：安装步骤：打开IDEA，点击File -> Settings ->...

AIGC 2024-05-30 人工智能

991阅读

超详细！AIGC面试系列大模型进阶(2)

本期问题快览 1. 如何让大模型处理更长的文本？ 2. 如果想要在某个模型基础上做全参数微调，究竟需要多少显存？ 3. 什么是有监督微调SFT 4. SFT 指令微调数据如何构建? 5. 领域数据训练后，通用能力往往会有所下降，如何缓解模型遗忘...

人工智能 2024-05-30 人工智能

1776阅读

Kohya 训练器 Stable Diffusion工作流中训练LoRA模型方法

本文档是关于Stable Diffusion工作流中训练LoRA模型方法的文档一.前置训练集准备第一步：准备训练集：准备训练模型时使用的训练集。注意：训练集应当能尽量涵盖训练对象的“多样化样本”。如角色立绘图，各个角度不同的图片。...

人工智能 2024-05-30 人工智能

2671阅读

Springboot整合文心一言----非流式响应与流式响应（前后端）

所谓非流式响应就是直接等待百度把答案生成好之后直接返回给你，而后者这是一一种流的形式，百度一边生成答案，一边将答案进行返回，这样就是我们在使用ChatGPT中最常见的一种表现了，它回答问题的时候总是一个字一个字的出来。这两回答方式都有一定的...

大数据 2024-05-30 人工智能

1492阅读

【stable diffusion】在AutoDL算力云平台部署stable diffusion

文章中提到的网址连接 AutoDL的网址连接：https://www.autodl.com/Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像，尽管它也可以应用于其他任务，如内补绘制、外补绘制...

AIGC 2024-05-30 人工智能

1419阅读

百度文心一言：官方开放API开发基础

目录一、模型介绍 1.1主要预置模型介绍 1.2 计费单价二、前置条件 2.1 创建应用获取 Access Key 与 Secret Key 2.2 设置Access Key 与 Secret Key 三、基于千帆SDK开发 3.1 M...

大数据 2024-05-30 人工智能

1409阅读

Stable Diffusion教程：提示词（模型、插件、安装包可分享）

什么是提示词文章提到的模型、插件、安装包都可分享，需要的小伙伴文末领取！你可能没写过提示词，但是一定听说过“提示词”这几个字，也大概能知道它的重要性。没听说过也没关系，下面我就带你认识认识。提示词就是我们给AI模型下发的指令。提示词写对了...

大数据 2024-05-30 人工智能

982阅读

stable diffusion controlnet前处理中的图像resize

在SD controlnet应用中，一般都要先安装controlnet_aux，并在项目代码中import相关前处理模块，如下所示。在对control image进行前处理（比如找边缘，人体特征点）之前，往往会图像进行resize，这个resize...

人工智能 2024-05-30 人工智能

817阅读

Stable Diffusion教程|Controlnet插件详解和实战

不知道你是否发现，无论你再怎么精确使用文本提示词来指导SD模型，也无法描述清楚人物的四肢角度、背景中物体位置等等，因为文字的表达能力很有限。那么有没有一种通过图像特征来为扩散模型生成过程提供更加精细控制的方式，答案是肯定，那就是ControlNet！目...

生成式AI 2024-05-30 人工智能

1053阅读

用GPT-3.5生成数据集！北大天工等团队图像编辑新SOTA，可精准模拟物理世界场景

高质量图像编辑的方法有很多，但都很难准确表达出真实的物理世界。那么，Edit the World试试。图片来自北京大学、Tiamat AI、天工AI、Mila实验室提出了EditWorld，他们引入了一种新的编辑任务，即世界指令（world-ins...

大数据 2024-05-30 人工智能

836阅读

Midjourney该怎么用？从零基础到落地实践

前言从注册登录到基本的操作界面，提示词组成后缀介绍，到主流的生成图片的方式，以及最重要的提示词咒语分享，还有一些我的使用心得，希望对大家有帮助！喜欢的话欢迎关注我，欢迎点赞收藏评论！～一、AI绘画的背景 1.1 AI绘画的发展最...

生成式AI 2024-05-30 人工智能

1431阅读

【喂饭级AI教程】手把手教你在本机安装Stable Diffusion秋包【附带全套资源】

今天，我们将探索一个为Bilibili社区核心贡献者秋叶大佬所发布的神器——一款整合软件包。这款软件巧妙地简化了学习Python和网络知识这一通常漫长的过程。即使是编程新手，也能轻松入门并开始使用Stable Diffusion（简称SD），并且几乎不需要...

生成式AI 2024-05-29 人工智能

1156阅读

AI绘画：使用Stable Diffusion ComfyUI进行换脸：IPAdapter FaceID全面教程

在数字艺术和媒体编辑领域，换脸技术已经成为一种流行且强大的工具。它允许创作者将一个人物的面部特征无缝地转移到另一个人物上，创造出令人信服的视觉作品。Stable Diffusion ComfyUI提供了一个高效的平台，让用户能够轻松地实现换...

AIGC 2024-05-29 人工智能

4261阅读

详解各种LLM系列｜LLaMA 2模型架构、预训练、SFT内容详解 (PART1)

作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/670002922 大家好，这里是 NewBeeNLP。之前我们分享了详解各种LLM系列｜...

生成式AI 2024-05-29 人工智能

1475阅读

一文速览Llama 3及其微调：从如何把长度扩展到100万到如何微调Llama3 8B

前言 4.19日凌晨正准备睡觉时，突然审稿项目组的文弱同学说：Meta发布Llama 3系列大语言模型了，一查，还真是本文以大模型开发者的视角，基于Meta官方博客的介绍：Introducing Meta Llama 3: The most capa...

AIGC 2024-05-29 人工智能

1953阅读

Midjourney从入门到实战：Midjourney制作电影级镜头体验(附prompts)_ai绘画制作的电影视觉特效

?Midjourney是目前主流的一款AI生成图像工具，它风格多样，细节丰富，创作自由，涵盖文生图、图生图、图图结合等模式。对于艺术创作者来说，它可以扩展能力、提高效率，增加创意；对于大众爱好者来说，没有任何美术基础也可以进行艺术创作！本专栏详细介绍了Mi...

人工智能 2024-05-29 人工智能

1098阅读

最新ChatGPT4.0工具使用教程：GPTs使用，Midjourney绘画，AI换脸，Suno-AI音乐生成大模型一站式系统使用教程

一、前言 ChatGPT3.5、GPT4.0、相信对大家应该不感到陌生吧？简单来说，GPT-4技术比之前的GPT-3.5相对来说更加智能，会根据用户的要求生成多种内容甚至也可以和用户进行创作交流。然而，GPT-4对普通用户来说都是需要额外付费才可以使用...

生成式AI 2024-05-29 人工智能

1248阅读

普通人在电脑上尝鲜AI技术的三种方式

TechWeb 文 / 新喀鸦随着科技的飞速发展，人工智能（AI）已经不再是遥不可及的未来科技，而是逐步融入我们生活的各个角落。从智能家居的便捷操控，到线上服务的智能推荐，再到医疗、教育等行业的深度应用，AI正以其独特的魅力改变着世界。然而，对于许多普通...

大数据 2024-05-29 人工智能

781阅读

Google Bard的Gemini Pro最新升级；Nomic Embed: 开源文本嵌入模型

? AI新闻 ? Google Bard的Gemini Pro最新升级摘要：Bard现在可以在超过40种语言和230多个国家和地区使用Gemini Pro，提供更强大的理解、推理、总结和编码能力。 Bard的双重检查功能将扩展到40多种语言，用户...

生成式AI 2024-05-29 人工智能

1010阅读

OpenAI 开源的免费 AI 语音转文字工具 - Whisper，一步一步本地部署运行

Whisper 是 OpenAI 研发的一个通用的语音识别模型，可以把语音转为文本。它在大量多样化的音频数据集上进行训练，同时还是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。一、使用场景语音 => 文字是一个非常实用的功能，...

生成式AI 2024-05-29 人工智能

1951阅读

详解生成式人工智能的开发过程

译者 | 晶颜审校 | 重楼开发生成式人工智能应用程序与开发传统的机器学习应用程序非常不同，以下是步骤详解。回到机器学习的“古老”时代，在您可以使用大型语言模型(LLM 作为调优模型的基础之前，您基本上必须在所有数据上训练每个可能的机器学习模型，...

人工智能 2024-05-29 人工智能

1092阅读

AI绘画进阶工具ComfyUI 傻瓜整合包安装教程！模型共享，一键安装！

哈喽大家好，今天给大家分享一下AI绘画工具Stable Diffusion的另一种UI界面，常见的有：窗口式界面的WebUI 节点式工作流的ComfyUI ComfyUI更加进阶一些，是一个节点式工作流的AI绘画界面，它高度可定制、自定义编辑Ai生...

人工智能 2024-05-29 人工智能

2660阅读

数据驱动与 LLM 微调：打造 E2E 任务型对话 Agent

作者 | Thought Agent 社区在对话系统的设计和实现中，传统的基于 Rasa-like 框架的方法往往需要依赖于多个模块的紧密协作，例如我们在之前的文章中提到的基于大模型（LLM）构建的任务型对话 Agent，Thought Agent，其...

生成式AI 2024-05-29 人工智能

1219阅读

现在可以用GPT-4O 自动生成 Figma 设计稿了

近期，由GPT-4o提供支持的技术能够根据产品需求文档（PRD）自动生成Figma设计稿。这一技术主要针对移动端应用进行优化，支持使用高质量的设计系统，如Ant Design Mobile和Arco Mobile。该技术支持将PRD解析为特定的数据格式...

人工智能 2024-05-29 人工智能

907阅读

ai写作软件推荐哪个？选这6个让写作变得简单又高效

转眼间已到了四月中旬，部分大学生们还在为毕业论文犯愁。选题、构思、撰写，每一步都充满了挑战与困扰。时间紧迫、思路枯竭、文笔不济……这些问题成了许多毕业生心中的“拦路虎”，让人望而生畏。别担心！今天来给大家安利6款超好用的AI写作生成软件，让它们...

生成式AI 2024-05-29 人工智能

917阅读

2500页算法文档泄露！搜索史上最强黑箱曝光，谷歌翻车再升级？

撰稿丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）谷歌有点流年不利。前两天刚被曝出，其搜索新推出的“AI 摘要（AI Overviews）”功能经常提供严重错误的搜索结果信息，例如，荒唐地建议用户用胶水来防止披萨上的奶酪滑落...

人工智能 2024-05-29 人工智能

935阅读

微软、亚马逊、IBM 承诺公布 AI 模型的安全措施

在首尔举行的 AI 安全峰会上，微软、亚马逊和 IBM 等领先科技公司承诺在开发基础模型时公布他们所采取的安全措施。这些公司都同意，如果无法控制或减轻 AI 模型所带来的风险，将不会开发或部署该模型。图源备注：图片由AI生成，图片授权服务商Midjou...

人工智能 2024-05-29 人工智能

959阅读

Stable Diffusion初级教程

一、入门篇 1. 理解基本概念扩散模型（Diffusion Models）：扩散模型是一种生成模型，通过逐步添加噪声到数据样本中，然后学习如何逐步去除这些噪声来恢复原始数据。 Latent Diffusion Model (LDM ：LDM是...

大数据 2024-05-29 人工智能

1115阅读

一年心血被毁，OpenAI超级对齐负责人愤而出走Anthropic！Ilya去向依旧成谜

OpenAI超级对齐团队负责人Jan Leike，在前不久愤而宣布辞职后，刚刚公布了自己的新去向——入职Anthropic。 Anthropic，俨然已经成为OpenAI离职人员的「避难所」，OpenAI价值观对立面的大本营。 Jan Leike开心表示...

AIGC 2024-05-29 人工智能

858阅读

AI工程师薪酬远超其他同行！入门级平均超170万元

快科技5月29日消息，根据Levels.fyi发布的2024年第一季度AI工程师薪酬调查数据，人工智能（AI）工程师的薪酬远超非AI软件工程师。调查结果表明，不同级别的AI工程师薪酬普遍高于非AI工程师。具体来看，入门级AI工程师的平均薪酬为239000...

生成式AI 2024-05-29 人工智能

862阅读

OpenAI Whisper 语音转文本实验

为了实现语音方式与大语言模型的对话，需要使用语音识别（Voice2Text）和语音输出（Text2Voice）。感觉这项技术已比较成熟了，国内也有许多的机构开发这项技术，但是像寻找一个方便测试的技术居然还不容易。Google 墙了，微...

AIGC 2024-05-29 人工智能

1087阅读

Meta AI的首席执行官LeCun：不要从事LLM工作

出品 | 51CTO技术栈（微信号：blog51cto）在巴黎举行的初创企业年度技术大会VivaTech上，Meta AI的首席执行官Yann LeCun建议希望在AI生态系统中工作的学生不要从事LLM（大型语言模型）方面的工作。 “如果你是对构建下一...

AIGC 2024-05-29 人工智能

856阅读

Karpathy新教程爆火，网友抢着送他H100：从头复现GPT-2训练

大神Karpathy已经不满足于用C语言造Llama了! 他给自己的最新挑战:复现OpenAI经典成果，从基础版GPT-2开始。挑战成功本身并不意外，但是只花费20美元、90分钟完成训练，Loss和评测还超越原版，就!有!点!过!分!了!。不仅如此，...

人工智能 2024-05-29 人工智能

831阅读

Meta Llama 3本地部署

感谢阅读环境安装收尾环境安装项目文件下载完后在根目录进入命令终端（windows下cmd、linux下终端、conda的话activate）运行 pip install -e . 不要控制台，因为还要下载模型。这...

生成式AI 2024-05-29 人工智能

938阅读

GPT-5倒计时！奥特曼踢走Ilya得逞，宫斗惊人内幕再曝光

「OpenAI下一代前沿模型，正在训练中」。经历了几周前Ilya、安全团队负责人Jan Leike离职后，超级对齐团队也被OpenAI解散。今天，奥特曼领衔的OpenAI全新的「安全与保障委员会」官宣成立。不仅如此，OpenAI预计，正在训练的下...

AIGC 2024-05-29 人工智能

942阅读

研究发现：OpenAI 的 GPT-4 在金融分析领域具有 “相对优势”：

根据芝加哥大学布斯商学院的一项研究，OpenAI 的 GPT-4在金融分析和预测方面超越了人类分析师，即使没有行业特定信息。这项研究上周公布，发现 GPT-4这一大型语言模型在分析财务报表和预测未来收益方面表现出色。研究称:“即使没有任何叙述或行业特定信息...

生成式AI 2024-05-29 人工智能

932阅读

SD(Stable Diffusion) 简易教程

最近给家里的小朋友用 SD(Stable Diffusion 生成卡通头像，顺便记录一下 SD 的基础使用教程。教程目录 SD 安装与部署认识模型和插件基础使用教程 SD 安装与部署 SD 安装和部署可以分为本地和云端。本...

生成式AI 2024-05-29 人工智能

1592阅读

谷歌搜索算法内幕被扒，2500页巨细文件实名泄密！搜索排名谎言被揭穿

日前，谷歌2500页的内部文档被泄露，揭示了搜索——「互联网最强大的仲裁者」的运作方式。爆料人是SparkToro的联合创始人兼CEO，他在自家网站上发表博客文章，宣称「一位匿名人士与我分享了数千页泄露的谷歌搜索API文档，SEO中的每个人都应该看到它...

大数据 2024-05-29 人工智能

882阅读

Khoj：一个开源的个人化AI助手轻松连接本地与在线文档

Khoj 是一个功能丰富、开源的个人化AI助手，旨在帮助用户管理和检索各种信息源，同时提供多种智能功能以提升工作效率。以下是Khoj的主要特点、功能及应用场景: 主要特点多源信息获取:能够连接本地和在线文档，包括PDF、Markdown文件、Git...

AIGC 2024-05-29 人工智能

952阅读

【ollama】（2）：在linux搭建环境，编译ollama代码，测试qwen大模型，本地运行速度飞快，本质上是对llama.cpp 项目封装

关于 ollama 项目 https://github.com/ollama/ollama/tree/main/docs https://www.bilibili.com/video/BV1oS421w7aM/ 【ollama】（2...

生成式AI 2024-05-29 人工智能

2022阅读

LlamaIndex：如何为大模型加载一个AI知识库？

大模型被喻为人类正在经历的一场科技革命，而横亘在大模型和实际业务场景之间的，是大模型在面对企业复杂业务场景时解决问题的能力，要具备这样的能力，数据是关键。这其中需要的数据，不是通用大模型训练时用到的那些常见数据，而是与企业业务相关的数据，这些数据是大...

人工智能 2024-05-29 人工智能

814阅读

商汤日日新大模型5.0粤语版发布定价30港元1M tokens

商汤科技正式发布了全新的“日日新大模型5.0粤语版”。这一版本不仅定价亲民，以30港元的价格提供1M tokens（输入与输出均同价）的优质服务，而且支持最大128K窗口，确保用户在使用过程中获得流畅、高效的体验。此外，“商量粤语版”还将推出网页版和Ap...

AIGC 2024-05-29 人工智能

777阅读

手把手教你基于华为云，实现MindSpore模型训练

本文分享自华为云社区《【昇腾开发全流程】MindSpore华为云模型训练》，作者：沉迷sk。前言学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。并打通一个Ascend910训练到Ascend310推理的全流程...

大数据 2024-05-29 人工智能

933阅读

AIGC重塑金融：AI大模型驱动的金融变革与实践，2024年最新阿里面试二面

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。深知大多数HarmonyOS鸿蒙开发工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不...

AIGC 2024-05-29 人工智能

908阅读

奥特曼挂帅新团队，OpenAI新一代大模型开训，前任高管却「投敌」了

在联合创始人、首席科学家 Ilya Sutskever 官宣离职、超级对齐团队被解散之后，OpenAI 研究的安全性一直备受质疑。现在，OpenAI 董事会宣布成立新的安全与保障委员会，由董事 Bret Taylor（董事会主席）、Adam D’Ang...

大数据 2024-05-29 人工智能

822阅读

AI日报：GPT-4o可自动生成Figma设计稿；视频换衣被I2VEdit搞定了；抖音“AI证件照”特效爆火；和GPT4玩狼人杀，人类因太蠢出局

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、又炸！GPT-4o可自动生成F...

生成式AI 2024-05-29 人工智能

976阅读

当前都在堆长窗口，还需要 RAG 吗？

自从谷歌的 Gemini 1.5 Pro 发布后，行业内就有不少人在背后“蛐蛐” RAG。一方面是因为，Gemini 的表现确实亮眼。根据官方发布的技术报告，Gemini 1.5 Pro 能够稳定处理高达100 token，相当于1小时的视频、11小时...

人工智能 2024-05-29 人工智能

1090阅读

通俗易懂的Stable Diffusion模型结构介绍

目录 SD的发展历程 SD 模型的网络结构 ClipText 文本编码器文本向量输入Unet VAE模型总结图 SD的发展历程 Stab...

AIGC 2024-05-29 人工智能

1336阅读