-
如何使用TensorFlow和Cleanvision检测大堡礁的海星威胁?
澳大利亚的大堡礁美不胜收,是全球最大的珊瑚礁,也是多种多样的海洋生物栖息的家园。不幸的是,珊瑚礁面临蚕食珊瑚的棘冠海星(COTS)的威胁。为了控制COTS爆发,珊瑚礁管理人员使用一种名为Manta Tow勘查的方法,将潜水员拖在船后,目测评估珊瑚礁的各...
-
AI绘画
AI 绘画 智能文生图-API 文档-文档中心-腾讯云 使用HTTP请求直接调用 然后,在你的Controller类中,你可以使用Spring的RestTemplate类来发送HTTP请求。以下是一个简单的示例: import org.springf...
-
使用Kohya_ss训练Stable Diffusion Lora
Stable Diffusion模型微调方法 Stable Diffusion主要有 4 种方式:Dreambooth, LoRA, Textual Inversion, Hypernetworks。 Textual Inversion (也称为 Em...
-
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试
2023年10月,我们发表了一篇关于TimeGPT的文章,TimeGPT是时间序列预测的第一个基础模型之一,具有零样本推理、异常检测和共形预测能力。 虽然TimeGPT是一个专有模型,只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了...
-
如何探索和可视化用于图像中物体检测的 ML 数据
近年来,人们越来越认识到深入理解机器学习数据(ML-data)的必要性。不过,鉴于检测大型数据集往往需要耗费大量人力物力,它在计算机视觉(computer vision)领域的广泛应用,尚有待进一步开发。 通常,在物体检测(Object Detectio...
-
每日互动(个推)CTO叶新江:AIGC时代,大模型推动数据要素商业化
ChatGPT在一夜之间火爆互联网,让AIGC受到世界范围内的高度关注。时至今日,AIGC热度持续高涨,各大互联网公司争相布局这一领域。日渐成熟的技术、显著的降本增效优势以及日益增长的市场需求等因素,已经推动AIGC成为互联网公司新一轮必争之地。 在近期...
-
Stable Diffusion结构解析-以图像生成图像(图生图,img2img)
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) AIGC专栏3——Stable Diffusion结构解析-以图像生成图像(图生图,img2img)为例 学习...
-
Docker部署Stable-Diffusion-webui
前排提示:如果不想折腾,可直接跳到最后获取封装好的容器,一键运行 :D 前言 乘上AI生成的快车,一同看看沿途的风景。 启一个miniconda容器 docker run -itd -v 宿主机内SD项目路径:/tmp --gpus all --...
-
基于LLaVA开源模型打造视频聊天助手
简介 大型语言模型已经证明自己是一项革命性的技术。目前,人们已经开发出了许多基于大型语言模型功能的应用程序,而且预计很快还会有更多的应用程序问世。大型语言模型最有趣的应用之一是将其部署为智能助手,它们能够帮助人类用户完成各种任务。 人们已经能够通过指令微...
-
[AIGC] Spring Gateway:一个简单 yet powerful API 网关
Spring Gateway(Spring Cloud Gateway)是 Spring 基金会下的一个开源项目,它是一个基于 Spring 5、Project Reactor、Spring Boot 2 和 Spring WebFlux 的简单 yet...
-
19|Whisper+ChatGPT:请AI代你听播客
今天,我们的课程开始进入一个新的主题了,那就是语音识别。过去几周我们介绍的 ChatGPT 虽然很强大,但是只能接受文本的输入。而在现实生活中,很多时候我们并不方便停下来打字。很多内容比如像播客也没有文字版,所以这个时候,我们就需要一个能够将语音内容转换成...
-
揭开向量索引概念的神秘面纱
自从ChatGPT公开发布以来,人们几乎没有一天不讨论LLM(大型语言模型)、RAG(检索增强生成:Retrieval Augmented Generation)和向量数据库的新内容。技术世界充斥着LLM的可能性,LLM被视为将改变我们生活的最新技术:...
-
AIGC:导航网站精选
文章目录 @[toc] 简介 AIGC导航 https://www.aigc.cn 潮点AI https://aichaodian.com AI工具集 https://ai-bot.cn FuturePedia https://ww...
-
每日一看大模型新闻(2023.12.13)趣味项目CLoT:训练LLM更幽默地回答问题;用RLHF 2%的算力让LLM停止有害输出,字节提出LLM遗忘学习;2.7B能打Llama 2 70B,微软祭出
1.产品发布 1.1 2.7B能打Llama 2 70B,微软祭出「小语言模型」 发布时间:2023-12-13 2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini na...
-
AIGC时代:大模型ChatGPT的技术实现原理、行业实践以及商业变现途径
大数据与人工智能实战专家—周红伟老师 法国科学院数据算法博士/曾任猪八戒大数据科学家/曾任马上消费金融风控负责人 课程背景 2023年,以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼...
-
用通俗易懂的方式讲解:使用Llama-2、PgVector和LlamaIndex,构建大模型 RAG 全流程
近年来,大型语言模型(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。其中RAG(Retrieval Augmented Generation,检索增强生成)是解决幻觉比较有效的方法。 本文,我们将深入研究使用trans...
-
LLaMA-Factory添加adalora
感谢https://github.com/tsingcoo/LLaMA-Efficient-Tuning/commit/f3a532f56b4aa7d4200f24d93fade4b2c9042736和https://github.com/huggingf...
-
国内大厂这么玩AI就对了!AI绘画版权攻防「黑魔法」;用AI赚到钱的人做对了什么;Agent机遇全解析;2024生成式AI学习路线图 | ShowMeAI日报
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🉑 小红书「AI涂鸦」,抖音「AI扩图」,国内大厂找到了AI正确打开方式 配图说明:小红书AI创作工具「此刻」 使用方式:点击首页底部「+」...
-
奥特曼7万亿美元芯片帝国野心曝光,OpenAI日产1000亿单词欲接管全世界!
【新智元导读】Sam Altman表示,自己需要7万亿美元建起全球的芯片帝国,他已经在全球搜罗金主,包括中东土豪。 就在刚刚,Sam Altman发推表示: 如今,OpenAI每天能够创造出约1000亿字的内容,而全世界的人类每天总共能产生约100万亿字。...
-
WhisperBot:整合了Mistral大型语言模型的实时语音转文本系统
项目简介 欢迎来到 WhisperBot。WhisperBot 基于 WhisperLive 和 WhisperSpeech 的功能而构建,在实时语音到文本管道之上集成了大型语言模型 Mistral (LLM 。WhisperLive 依赖于 OpenA...
-
AIGC|LangChain新手入门指南,5分钟速读版!
如果你用大语言模型来构建AI应用,那你一定不可能绕过LangChain,LangChain是现在最热门的AI应用框架之一,去年年底才刚刚发布,它在github上已经有了4.6万颗星的点赞了,在github社区上,每天都有众多大佬,用它创造一些很新很酷的应用...
-
Stable Diffusion结构解析-以图像生成图像!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) AIGC专栏3——Stable Diffusion结构解析-以图像生成图像(图生图,img2img)为例 学习...
-
酒精和肠内外健康:有帮助还是有害?
谷禾健康 酒精与健康 饮酒作为一种特殊的文化形式,在我们国家有其独特的地位,在几千年的发展中,酒几乎渗透到日常生活、社会经济、文化活动之中。 据2018年发表的《中国饮酒人群适量饮酒状况》白皮书数据显示,中国饮酒人...
-
m2安装stable-diffusion报错及解决方案
背景:自己的电脑是macbookpro m2,之前装很多软件都遇到各种问题,不出意外,装这个stable-diffusion一样遇到各种问题,现在总结一下安装过程中遇到的问题。 报错一: Launching Web UI with argument...
-
【AIGC】Diffusers:加载管道、模型和调度程序
前言 拥有一种使用扩散系统进行推理的简单方法对于🧨扩散器至关重要。扩散系统通常由多个组件组成,例如参数化模型、分词器和调度器,它们以复杂的方式进行交互。这就是为什么我们设计了 DiffusionPipeline,将整个扩散系统的复杂性包装成一个易于使用的...
-
20240131在WIN10下配置whisper
20240131在WIN10下配置whisper 2024/1/31 18:25 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最新的545版本的驱动程序...
-
Llama-7b-hf和vicuna-7b-delta-v0合并成vicuna-7b-v0
最近使用pandagpt需要vicuna-7b-v0,重新过了一遍,前段时间部署了vicuna-7b-v3,还是有不少差别的,transforms和fastchat版本更新导致许多地方不匹配,出现很多错误,记录一下。 更多相关内容可见Fastchat实战...
-
Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj
安装llama-cpp-python包时,出现下述问题: Collecting llama-cpp-python Using cached llama_cpp_python-0.2.28.tar.gz (9.4 MB Installing bu...
-
如何在Linux上安装Stable Diffusion WebUI
Stable Diffusion WebUI是一个基于AUTOMATIC1111的stable-diffusion-webui仓库的项目,允许用户通过web界面轻松地生成AI驱动的图像。本文将指导您在Linux系统上完成Stable Diffusion W...
-
使用 Amazon SageMaker 和 Amazon CodeWhisperer,解锁数据见解
关键字: [Amazon Web Services re:Invent 2023, Amazon Kendra, Generative Ai, Amazon Sagemaker, Amazon Kendra, Amazon Bedrock, Vector...
-
stable diffusion实践操作-SD原理
系列文章目录 本文专门开一节写SD原理相关的内容,在看之前,可以同步关注:stable diffusion实践操作 文章目录 系列文章目录 前言 一、原理说明 1.1、出图原理 1.1.1 AI画画不是和人一样,从0开始,而是一...
-
20240127在ubuntu20.04.6下配置whisper
20240131在ubuntu20.04.6下配置whisper 2024/1/31 15:48 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最新的驱动...
-
超详细!AI 绘画神器 Stable Diffusion 基础教程
一、AI 绘画工具的选择与运用 1. 工作场景下 AI 绘画工具的选择 目前文生图的主流 AI 绘画平台主要有三种:Midjourney、Stable Diffusion、DALL·E。如果要在实际工作场景中应用,我更推荐 Stable Diffusi...
-
今天起,他是黄仁勋院士!2024美国工程院院士名单出炉,清华黄翊东等当选外籍院士
今天,2024年美国工程院新晋院士名单公布! 英伟达老黄当选,除此之外,名单中还有不少华人。 根据官方介绍,美国国家工程院选出了114名新晋院士,以及21名外籍院士。这使得美国成员总数达到2310人,外籍成员总数达332人。 当选美国国家工程院院士,...
-
Stable Diffusion 基本原理
1 Diffusion Model的运作过程 输入一张和我们所需结果图尺寸一致的噪声图像,通过Denoise模块逐步减少noise,最终生成我们需要的效果图。 图中Denoise模块虽然是同一个,但是它会根据不同step的输入图像和代表noise严重程...
-
GitHub Copilot 的10种意想不到的使用方法
了解如何将人工智能编程助手的能力扩展到代码生成之外。 作为开发者我们知道,开发应用不仅仅是编写代码,还有一些其他相关工作要做:有提交消息要写,CLI命令要执行,还有晦涩的语法要记住。虽然你可能已经使用GitHub Copilot来支持你的编码,但你知...
-
斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了
最新一代语言模型(尤其是 GPT-4、PaLM 和 LLaMa)已经成功拓展了自然语言处理和生成的边界。这些大规模模型可以解决许多不同任务,从写莎士比亚风格的十四行诗到总结复杂的医疗报告和解决竞赛级的编程问题。尽管这些模型可以解决多种多样的问题,但它们并...
-
【读点论文】A Survey on Generative Diffusion Model,AIGC时代的新宠儿,从原理推导到工程应用,在视觉,自然语言,语音等领域大展拳脚
A Survey on Generative Diffusion Model Abstract 由于深度潜在表示,深度学习在生成任务中显示出良好的潜力。生成模型是一类可以根据某些隐含参数随机生成观测值的模型。近年来,扩散模型以其强大的生成能力成...
-
斯奇拉姆排序 - 基于公平性的排序学习
在 2023 年结束的国际学术会议 AIBT 2023 上,Ratidar Technologies LLC 宣读了一篇基于公平性的排序学习算法,并且获得了该会议的最佳论文报告奖。该算法的名字是斯奇拉姆排序 (Skellam Rank ,充分利用了统计学...
-
Centos7 部署 Stable Diffusion
参考:https://www.jianshu.com/p/ff81bb76158a 一、安装最新版 git yum install libcurl-devel curl-devel -y # 安装依赖库 yum -y install zlib-dev...
-
Pika:AIGC新秀,视频生成产业或迎来GPT时刻
今天分享的AIGC系列深度研究报告:《Pika:AIGC新秀,视频生成产业或迎来GPT时刻》。 (报告出品方:中泰证券) 报告共计:11页 Pika:专注Text to Video生成场景,支持3D和动漫 ◼ Pika成立于2023年5月,是一...
-
GPT4、文心一言4、ChatGLM、Claude2.1四大语言模型生成效果对比
随着AIGC大风起,也掀起了语言模型大争之世,各种语言模型如雨后春笋,让大家眼花缭乱。周周都有新的选手入场,月月都有新的模型问世。不过其中最受人瞩目的当属GPT4、文心一言4、ChatGLM、Claude2.1四大模型。隐隐有傲视群雄之姿,...
-
通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5
赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。 新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medi...
-
MedicalGPT:基于LLaMA-13B的中英医疗问答模型(LoRA)、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。
项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身...
-
AIGC在物联网与智能制造中的实践
1.背景介绍 1. 背景介绍 物联网和智能制造是当今最热门的技术领域之一,它们在各种行业中发挥着重要作用。随着计算机视觉、自然语言处理和机器学习等技术的发展,人工智能(AIGC 在物联网和智能制造领域的应用也日益增多。本文将探讨AIGC在物联...
-
Bumble推出新AI工具可识别并阻止诈骗帐户、虚假个人资料
据国外媒体报道,在线约会应用Bumble 今天宣布推出一款新的人工智能功能,名为 Deception Detector,旨在帮助识别垃圾邮件、诈骗和欺骗个人数据。这一创新工具将在用户发现恶意内容之前自动采取行动,有效提高用户在线安全体验。 其中,Bumbl...
-
LLaVA:GPT-4V(ision) 的开源替代品
LLaVA(大型语言和视觉助理)(链接::https://llava-vl.github.io/)是一个很有前途的开源生成式人工智能模型,它复制了OpenAI GPT-4在图像转换方面的一些功能。用户可以将图像添加到LLaVA聊天对话中,允许讨论这些图像...
-
ChatGPT实战100例 - (14) 打造AI编程助手 Code Copilot
文章目录 ChatGPT实战100例 - (14 打造AI编程助手 Code Copilot 一、Code Copilot AI编程助手 二、制作代码生成器 2.1 定义生成器框架 2....
-
stable diffusion如何确保每张图的面部一致?
可以使用roop插件,确定好脸部图片后,使用roop固定,然后生成的所有图片都使用同一张脸。 这款插件的功能简单粗暴:一键换脸。 如图所示: 任意上传一张脸部清晰的图片,点击启用。 在其他提示词不变的情况下,Stable Diffu...
-
ChatLaw:基于LLaMA微调的法律大模型
文章目录 动机 数据组成 模型框架 模型评估 北大团队发布首个的中文法律大模型落地产品ChatLaw,为大众提供普惠法律服务。模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。 github地址:https://g...