-
大模型真能解决一切吗?关于知识驱动自动驾驶的一些思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 上个星期受邀在外面做了一次关于「知识驱动自动驾驶」的讲座,刚好借这个机会把之前我和团队的一些学术上的思考整理凝练了一下。感觉里面一些内容还是挺值得拿出来分享&讨论的,所以开这么个帖子把其中一些关...
-
2个人的AI公司,1个半月吸引用户40万,马斯克都来点赞
Sam Altman说:“只要有人工智能,一个人就能经营10亿美元的公司。” 当Pika以4人团队展示高超技术时就已经让人大跌眼镜。 现在有一个团队,2个人做AI初创公司,上线不到2个月就开始盈利。 据El pais报道,这家西班牙公司目前确实只有2个人,...
-
AI初创公司Magnific AI一个半月吸引40万用户 仅两个员工
西班牙初创公司Magnific AI由仅有两名创始人,CEO Javi López和CTO Emilio Nicolás组成。这两位曾在国际在线社区Erasmusu共事10余年,创立了这家AI初创公司。 他们在2023年11月28日推出了Magnific...
-
【Python爬虫学习】总结了八种学习爬虫的常用技巧
此篇内容小结: 1)基本网页获取 2)爬虫ip被封的6个解决方法 3)爬虫绕过登录 4)Cookies处理 5)应对反爬的小招 6)验证码处理 7)gzip 压缩 8)爬虫中文乱码问题 基本网页获取 首先向一个 Url 地址发送请求,随后远端...
-
数学建模比赛中,chatgpt、文心一言如何提问更有效?
在数学建模的战场上,ChatGPT和文心一言可是我们的“神助攻”!但想让它们发挥出最大威力,提问可是个技术活。问题问得好,答案跑不了;问题问得妙,解决没烦恼! 下面我就一个实际的对话为例,带大家看看提问的技巧。 首先第一回合,先使用我教给大家的pro...
-
【多模态】13、Vision-Language 模型在视觉任务中的调研
文章目录 一、简介 二、基础知识 2.1 视觉任务的训练策略 2.2 VLM 基础 2.2.1 网络结构 2.2.2 预训练目标函数 2.2.3 评估和下游任务 2.3 数据集 三、迁移学习 3.1 使用 prompt tunin...
-
NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]
国内外大模型汇总列表 中国大模型列表大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。 Awesome family related to LLMS includes: https://github.com/wgwang...
-
如何使用Stable Diffusion的ReActor换脸插件
ReActor插件是从roop插件分叉而来的一个更轻便、安装更简单的换脸插件。操作简单,非常容易上手,下面我们就介绍一下,如何将ReActor作为stable diffusion的插件进行安装和使用。 一:安装ReActor插件 项目地址:https:...
-
抱抱脸正面挑战OpenAI,推出开源版GPT商店!完全免费、支持六大开源模型当底座
OpenAI的GPT商店有开源平替了—— 来自抱抱脸(Hugging Face)。 它新推出的“Hugging Chat Assistant”,也瞄准了让用户免费制定自定义聊天机器人。 图片 是的,完全免费,无需像OpenAI那样不开会员就被拒之门外。...
-
大模型没有护城河?OpenAI的“LLM城池”如何攻破,如何防守
作者 | Ben Dickson 译者 | 李睿 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 小模型、开源模型正在猛攻GPT-4,OpenAI需要更完善的措施来构建技术方面的护城河,以保护其LLM业务。 2023年5月,...
-
AI 绘画神器 Stable Diffusion 基础教程
AI 绘画工具的选择与运用 1.工作场景下 AI 绘画工具的选择 目前文生图的主流 Al 绘画平台主要有三种: Midjourney、Stable Diffusion、DALL·E-2 2.如果要在实际工作场景中应用,我更推荐 Stable Dif...
-
本地部署Stable Diffusion教程,详细教学,已安装成功,无科学上网版
前言 本篇文章参考多篇文章汇聚而成,安装遇到问题多半因为网络和环境问题,整理可供大家参考 一、Stable Diffusion是什么? Stable Diffusion是一个AI 绘图软件 (开源模型),可本地部署,可切换多种模型,且新的模型和开源库...
-
从Hugging Face下载数据测试whisper、fast_whisper耗时
时长比较短的音频:https://huggingface.co/datasets/PolyAI/minds14/viewer/en-US 时长比较长的音频:https://huggingface.co/datasets/librispeech_asr?r...
-
【书籍】强化学习第二版(英文版电子版下载、github源码)-附copilot翻译的中英文目录...
Python代码:https://github.com/ShangtongZhang/reinforcement-learning-an-introduction 英文原版书籍下载:http://incompleteideas.net/bo...
-
基于LLaMA Factory,单卡3小时训练专属大模型 Agent
大家好,今天给大家带来一篇 Agent 微调实战文章 Agent(智能体)是当今 LLM(大模型)应用的热门话题 [1],通过任务分解(task planning)、工具调用(tool using)和多智能体协作(multi-agent cooperat...
-
AIGC智能编程:编程革新还是就业陷阱?
AIGC智能编程:程序员的失业陷阱? 引言 随着人工智能的迅猛发展,智能编程技术也越来越受到关注。AIGC智能编程是一种利用人工智能技术自动生成代码的方法,它能够极大地提高编程效率和质量。然而,这种技术的兴起也引发了人们对程序员就业前景的忧虑。本文...
-
基于医疗领域数据微调LLaMA——ChatDoctor模型
文章目录 ChatDoctor简介 数据构建和训练过程 建立外部知识库 ChatDoctor相比ChatGPT有什么优势? ChatDoctor的效果 代码解读 train_lora.py文件解读 微调实战 下载仓库并进入目录 创建con...
-
stable diffusion实践操作-提示词-人物服饰
系列文章目录 stable diffusion实践操作-提示词 文章目录 系列文章目录 前言 一、提示词汇总 1.1 人物服饰1 1.2 人物服饰2 前言 本文主要收纳总结了提示词-人物服饰。 一、提示词汇...
-
Midjourney入门指南:简单提示词,搞定高质量应用设计
Midjourney是一款文本到图像的AI工具,可以根据纯文本描述生成图片,例如UI屏幕、应用程序图标、产品图片、标志和吉祥物等。虽然它不能替代UI设计师,但它可以在产品设计和视觉探索的早期阶段成为有帮助的工具。要使用Midjourney,您需要加入...
-
讯飞星火大模型重磅升级,对标GPT-4 Turbo!星火语音大模型发布,37个主流语种识别超OpenAI!
出品 | 51CTO技术栈(微信号:blog51cto) 1月30日,讯飞星火认知大模型V3.5成功发布!用核心能力的突破,回应时代的疑问。迈向更通用、实用的全民开放大模型,讯飞星火全面对标国际先进水平,同时首次发布星火语音大模型和星火开源大模型。 1、...
-
火爆到崩溃!揭秘字节版GPTs背后部门Flow
整理丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) “大语言模型只能编个贪吃蛇,而AI Agent可以整出一个王者荣耀。” 曾有人这样描述关于AI Agent的终极想象。 过去一年,国内外无数科技公司卷入了大模型混战中,随之兴起的...
-
Midjourney|文心一格prompt教程[技巧篇]:生成多样性、增加艺术风格、图片二次修改、渐进优化、权重、灯光设置等17个技巧等你来学
Midjourney|文心一格prompt教程[技巧篇]:生成多样性、增加艺术风格、图片二次修改、渐进优化、权重、灯光设置等17个技巧等你来学 1.技巧一:临摹 我认为学习图片类的 prompt,跟学习画画是类似的,最好的学习方法不是直接用模板。...
-
关于推荐系统,有六大让人震惊的“秘密”
推荐系统自1992 年代诞生以来, 到2024 年的今天已经有32 年的发展历程。在这几十年的发展历程中,各个互联网和科技公司上线过数以百万计的推荐系统模型。尽管推荐系统经历过 2012 到 2014 年的发展低潮,但很快就被后起之秀快手和字节跳动一改颓...
-
2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架
摘要: 2023-12-30 AIGC-LangChain指南-打造LLM的垂域AI框架 LangChain指南-打造LLM的垂域AI框架 CHATGPT以来,Langchain 可能是目前在 AI 领域中最热门的事物之一,仅次于向量数据库。...
-
大模型技术实践(三)|用LangChain和Llama 2打造心灵疗愈机器人
上期文章我们实现了Llama 2-chat-7B模型的云端部署和推理,本期文章我们将用“LangChain+Llama 2”的架构打造一个定制化的心灵疗愈机器人。有相关知识背景的读者可以直接阅读「实战」部分。 01 背景...
-
学习AIGC大模型必知的强化学习RL的核心代码示例,速进!!!
Look!👀我们的大模型商业化落地产品 📖更多AI资讯请👉🏾关注 Free三天集训营助教在线为您火热答疑👩🏼🏫 在人工智能的发展历程中,强化学习(RL)已成为推动技术突破的关键动力,尤其在自动化内容生成(AIGC)和大型语言模型(LLM)的领域中...
-
【思路合集】talking head generation+stable diffusion
1 以DiffusionVideoEditing为baseline: 改进方向 针对于自回归训练方式可能导致的漂移问题: 训练时,在前一帧上引入小量的面部扭曲,模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。 在像VoxCeleb或L...
-
阿里北交大实习生论文火了!MobileAgent 可模拟人类玩转手机,网友:加速剁手、吃土!
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) “太酷了,以后就靠AI帮我加速剁手吃土了。”近日一款名为MobileAgent的移动智能代理引起了圈内人的注意。 一个惊艳之处在于,这款Agent为“手机+GPT4”结合,做出...
-
Photo Factory官网体验入口 人工智能AI肖像生成服务平台在线使用地址
Photo Factory是一家领先的人工智能肖像生成服务平台,致力于为用户提供一键生成个性化肖像的革命性服务。通过上传正脸照片并选择理想的人物、性别、场景及着装风格,用户即可轻松生成独特个性的高清图像照片。此外,Photo Factory还提供改变发型发...
-
【深度学习】AIGC ,ControlNet 论文,原理,训练,部署,实战,教程(一)
论文:https://arxiv.53yu.com/pdf/2302.05543 代码:https://github.com/lllyasviel/ControlNet 得分几个博客完成这个事情的记录了,此篇是第一篇,摘录了一些论文内容。ControlN...
-
Android 拍照以及相册中选择(适配高版本)————上传头像并裁剪(一)
前言 在项目研发中,相信大家都遇到过给用户增加头像照片的需求。 随着手机版本的不断更新,android 8、android 9、android 10、android 12、android 13、鸿蒙系统等等;遇到这个功能需...
-
基于Rust的Zed编辑器已开源,内置对OpenAI和GitHub Copilot的支持
作者丨Tim Anderson 编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) Zed 编辑器项目(目前仍处于预发布阶段)现已在 AGPL、GPL 和 Apache 许可下开源。该编辑器以其高性能和多种AI辅助选择为特色,但目前仍...
-
Vision Pro大卖50亿小扎狂喜!Meta烧光500亿,VR复兴的希望来了
根据外媒曝料,2月2日正式发售之前,苹果的Vision Pro已经销售已经达到20万台,销售金额突破50亿美元! 图片 虽然对于苹果帝国巨大的体量来说,这个数字简直不值一提,但至少说明,消费者是愿意为这个3500刀的玩具买单的。 Vision Pro的媒...
-
AIGC内容分享(四十八):AIGC与创意设计之Canva:还是那个邻家女孩
目录 亲切温暖的邻家女孩 魔法室里魔法多 体验篇之:Magic Design 体验篇之:Magic Edit 创作者激励计划 结语 平易近人、积极向上,如邻家女孩般温暖,这或许就是用户对 Canva 的整体印象。 亲切温暖的邻...
-
OpenAI“复制粘贴”背后:剽窃者想要免费获得一切
如今,人们发表的文章或作品被剽窃,而剽窃者免费使用或为此获利的事例屡见不鲜。从互联网到AI,莫不如此。 比如,如今火热的OpenAI,其AI模型就很少为其使用的内容付费,该公司在2023年创造了13亿美元的收入。 OpenAI的狡辩 在《纽约时报》针对...
-
百度交了份“大”作业:文心一言用户破1亿,累计37亿字文本创作,能力再升32%!...
金磊 发自 凹非寺量子位 | 公众号 QbitAI 今年国产大模型的最后一声枪响,属于百度: 发布仅2个月,文心大模型4.0,能力又提升了32%。 文心一言用户规模超过1个亿! 这便是在深度学习“春晚”——WAV...
-
免费采集工具推荐,好文章值得收藏
采集工具的作用 在互联网的海洋中,有许多强大的免费采集工具,它们为用户提供了便捷、高效的方式,帮助用户从各种网站中收集、整理所需的信息。这些工具不仅广泛应用于市场研究、竞争情报等商业领域,同时也服务于学术研究、个人兴趣爱好等方面。 我们...
-
【探索科技 感知未来】文心一言大模型
【探索科技 感知未来】文心大模型 🚩本文介绍 文心一言大模型是由中国科技巨头百度公司研发的一款大规模语言模型,其基于先进的深度学习技术和海量数据训练而成。这款大模型具备强大的自然语言处理能力,可以理解并生成自然语言,为用户提供自然、流畅的语言交...
-
AIGC内容分享(三):AIGC应用:基于RAG构建个人知识库
目录 前言 Collect (收集 收集是什么? Organize (组织 组织信息 Distill (提炼 提炼信息 Express (表达 表达见解 Finetune调优 调整输出内容 总结一下 前言 在信息爆炸的...
-
stable-diffusion 安装和使用
安装: 在电脑上安装环境依赖 继续安装 把下面这两个文件复制到stable-diffusion-webui 下面 点击A...
-
无缝衔接Stable Diffusion,一张照片几秒钟就能生成个性化图片-InstantID
最近一段时间基于扩散模型的图像处理方法遍地开花,接下来为大家介绍一种风格化图像的方法InstantID,可以通过仅有一张人脸照片,几秒钟内生成不同风格的人物照片。与传统方法需要多张参考图像和复杂的微调过程不同,InstantID只需一张图像...
-
可爱小猫猫【InsCode Stable Diffusion美图活动一期】
一、 Stable Diffusion 模型在线使用地址:https://inscode.csdn.net/@inscode/Stable-Diffusion 二、模型版本及相关配置: 模型:chilloutmix_NiPruned...
-
PAI-ChatLearn :灵活易用、大规模 RLHF 高效训练框架(阿里云最新实践)
PAI-ChatLearn 是阿里云机器学习平台 PAI 团队自主研发的,灵活易用、大规模模型 RLHF 高效训练框架,支持大模型进行 SFT(有监督指令微调)、RM(奖励模型)、RLHF(基于人类反馈的强化学习)完整训练流程。PAI-ChatLear...
-
【Midjourney】绘画风格关键词
1.松散素描(Loose Sketch "Loose sketch"(松散素描)通常指的是一种艺术或设计中的手绘风格,其特点是线条和形状的表现相对宽松、自由,没有过多的细节和精确度。这样的素描通常用于表达创意、捕捉概念或者作为设计的初步草图。 L...
-
midjourney使用方法之如何画插画,midjourney小技巧分享
今天打算给大家分享一下midjourney使用方法小技巧,目前midjourney是可以画很多不一样的东西的,无论是设计还是插画,都是可以一一实现的,基本上是可以画出我们想到的所有东西,好了废话不多说,我们一起来看看。 一.midjourney画...
-
360度无死角!UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作
输入一张任意姿势的照片,想让照片里的人跟随「指定视频」来进行动作模仿并不简单,除了肢体动作的模仿外,模型还需要对运动过程中衣服、人物外观的变化进行建模。 如果输入图像是正面的,而模仿的视频动作包括转身的话,模型还需要「想象」出衣服的背面样子,以及衣...
-
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
来了,贾扬清承诺的 Lepton Search 开源代码来了。 前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。 项目链接:https://github.com/le...
-
AI在工业物联网(IIoT)中的安全管理与应用
作者 | 陈峻 审校 | 重楼 在开放的工业互联网环境中,数百万个基于物联网的终端和中间设备,需要全天候地持续通信并保持在线状态。不过,这些设备往往由于最初设计上的限制,在机密性、完整性、可用性、扩展性、以及互操作性上,存在着各种安全漏洞与隐患。与此同时...
-
RAG高阶技巧-如何实现窗口上下文检索
在本文中,我们将介绍一种提高RAG(Retrieval-Augmented Generation)模型检索效果的高阶技巧,即窗口上下文检索。我们将首先回顾一下基础RAG的检索流程和存在的问题,然后介绍窗口上下文检索的原理和实现方法,最后通过一个实例展...
-
webassembly003 whisper.cpp的项目结构CMakeLists.txt
注:带星号的为非重要部分 基础配置 cmake_minimum_required (VERSION 3.5 project(whisper.cpp VERSION 1.5.0 # Add path to modules list(APPEND...