-
DeepMind推出OPRO技术,可优化ChatGPT提示
在最新的AI研究报道中,Google DeepMind推出了一项名为“优化通过提示(OPRO)”的技术,将大型语言模型(LLM 作为其自身提示的优化器。该方法旨在通过自然语言描述问题,指导LLM生成和改进解决方案,从而提高提示性能。 OPRO的工作方式相对...
-
使用github copilot
现在的大模型的应用太广了,作为程序员我们当然野可以借助大模型来帮我们敲代码。 下面是自己注册使用github copilot的过程。 一、注册github copilot 1. 需要拥有github账号 ,登录github之后,点右侧自己的头像位置,...
-
gpt crawler:从URL爬取网站生成结构化知识,创建定制GPT
gpt crawler是一款强大的工具,能够将网站内容全面地爬取下来,并将其转换成结构化知识,为GPTs的学习提供了有力支持。 这个工具的应用场景广泛,比如,如果你想打造一个数字人分身,可以先将自己在社交媒体或个人博客上的内容抓取下来,然后提交给ChatG...
-
算法面试-深度学习基础面试题整理-AIGC相关(2023.9.01)
1、stable diffusion和GAN哪个好?为什么 ? Stable diffusion是一种基于随机微分方程的生成方法,它通过逐步增加噪声来扰动原始图像,直到完全随机化。然后,它通过逐步减少噪声来恢复图像,同时使用一个神经网络来预测下一步的噪...
-
新泽西州推出 AI 政策,指导州政府员工使用生成式AI
新泽西州州长 Phil Murphy 宣布推出一项新政策,指导州政府员工使用生成式人工智能。这项政策于11月17日宣布,是该州在此领域进行的其他工作的延续。其中包括于2023年10月成立的人工智能任务小组。该任务小组由行政命令创建,旨在评估人工智能的潜在影...
-
全网最全的AI绘画提示词网站,看这一篇就够了!
要说2023年什么最火,绝对是以ChatGPT为代表的AI工具了,特别是AI绘画,而用好AI的关键,就是要学会使用关键词,也叫提示词,提示词是AI绘画的核心,本次就给大家分享几个AI绘画关键词网站,各种高质量的图片你也能轻而易举的做出来。 先上一张脑...
-
ChatGPT创始人奥特曼“入伙”:微软市值逼近苹果
快科技11月21日消息,当地时间11月20日美股早盘,微软股价一度涨近2%,市值接近2.8万亿美元创历史新高,进一步逼近苹果公司。 得益于此次大涨,微软自年初以来的股价已累计上涨57%,每股达到了月377.1美元,而同期标普500指数涨幅约17.5%。 据...
-
从数据到诊断:谈青光眼的深度学习方法检测
青光眼是造成全球无数民众罹患不可逆失明的重要致残因素。青光眼本身只是统称,指代一系列对眼部与大脑视神经之间的连接造成损害的眼部疾病,严重时可导致视力丧失。根据布莱恩霍尔顿视觉研究所对全球失明及远视障碍原因的系统回顾与深入分析,青光眼已经成为全球第二大致...
-
Powder利用AI为游戏主播自动剪辑 可检测直播间取胜、击杀等重要瞬间
法国初创公司Powder最近推出了一款人工智能驱动的视频剪辑工具,它可以自动从游戏直播和视频中提取精彩片段,大大简化了游戏主播的后期编辑工作。 Powder训练了40多个游戏专用的AI模型,能够分析音频、检测笑声并找到游戏中的亮点时刻,如取胜、击杀等重要...
-
LLMs之LLaMA-2:基于text-generation-webui工具来本地部署并对LLaMA2模型实现推理执行对话聊天问答任务(一键安装tg webui+手动下载模型+启动WebUI服务)、同
LLMs之LLaMA-2:基于text-generation-webui工具来本地部署并对LLaMA2模型实现推理执行对话聊天问答任务(一键安装tg webui+手动下载模型+启动WebUI服务 、同时微调LLaMA2模型(采用Conda环境安装tg we...
-
微软发布 Azure ND H100 v5 虚拟机,配备 8 个英伟达 H100 GPU
IT之家 11 月 21 日消息,微软 Azure AI 基础设施迎来升级,推出了 ND H100 v5 虚拟机系列,这款虚拟机配备了英伟达 H100 Tensor Core 图形处理单元(GPU)和低延迟网络。 据介绍,微软全新发布 Azure ND...
-
OpenAI 危机:奥特曼被解雇 员工大规模外流至微软
萨姆·奥尔特曼周末被 OpenAI 董事会突然解雇,导致该公司面临人才外流危机。奥尔特曼随后宣布加入微软,出任新成立的人工智能部门的首席执行官。 与奥尔特曼一起离开的还有 OpenAI 总裁格雷格·布罗克曼和几名高级工程师。 OpenAI 员工签署了一封信...
-
硬刚ChatGPT!文心一言能否为百度止颓?
内容 研究ChatGPT技术,了解其应用场景和发展趋势。 分析百度当前的困境和挑战,探讨ChatGPT在解决这些问题中的潜在作用。 与团队成员合作,制定了一份ChatGPT在百度内部的应用计划,并进行了初步的实施。 参加了多个有关ChatGPT的研...
-
北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源
AI能理解搞笑视频笑点在哪里了。 北大等团队开源视觉语言大模型Video-LLaVA,将图像和视频表示对齐到统一的视觉特征空间,在13个图片和视频基准上达到先进的性能。 值得注意的是,Video-LLaVA在训练过程中没有使用成对的视频和图片数据,但...
-
windows10下whisper的安装使用和CUDA的配置
buzz基于whisper的客户端,可以优先尝试,支持Mac, Windows和Linux https://github.com/chidiwilliams/buzzhttps://github.com/chidiwilliams/buzz whis...
-
用检索增强生成让大模型更强大,这里有个手把手的Python实现
本文首先将关注 RAG 的概念和理论。然后将展示可以如何使用用于编排(orchestration)的 LangChain、OpenAI 语言模型和 Weaviate 向量数据库来实现一个简单的 RAG。 检索增强生成是什么? 检索增强生成(RAG)这一...
-
英伟达 nvidia 官方code llama在线使用
新一代编程语言模型Code Llama面世:重新定义编程的未来 随着人工智能和机器学习技术的迅速发展,我们现在迎来了一款革命性的大型编程语言模型——Code Llama。该模型是基于Llama 2研发的,为开放模型中的佼佼者,其性能达到了行业领先水平。...
-
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
人工智能(AI)在医学影像诊断方面的应用已经有了长足的进步。然而,在未经严格测试的情况下,医生往往难以采信人工智能的诊断结果。对于他们来说,理解人工智能根据医学影像给出的判别,需要增加额外的认知成本。 为了增强医生对辅助医疗的人工智能之间的信任,让 AI...
-
python语音识别whisper
一、背景 最近想提取一些视频的字幕,语音文案,研究了一波 二、whisper语音识别 Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 stable-...
-
微软230页报告,像素级评估GPT-4前沿科研能力:潜力无限速速上车!
LLM作为研究工具,能否帮助科学研究带来新的突破? 今天微软AI4Science Research抛出一篇230页的重磅论文,告诉所有的科研人员: LLM(GPT-4)太强了,赶快想办法用起来! 论文地址:https://arxiv.org/abs/2...
-
基于llama模型进行增量预训练
目录 1、llama模型转换(pytorch格式转换为HuggingFace格式 1.1、拉取Chinese-LLaMA-Alpaca项目 1.2、准备文件夹 1.3、下载llama官方原始模型 1.4、移动文件到指定位置 1.5、执行转换脚...
-
什么是Python爬虫?一篇文章带你全面了解爬虫
一、什么叫爬虫 爬虫,又名“网络爬虫”,就是能够自动访问互联网并将网站内容下载下来的程序。它也是搜索引擎的基础,像百度和GOOGLE都是凭借强大的网络爬虫,来检索海量的互联网信息的然后存储到云端,为网友提供优质的搜索服务的。 二、爬虫有什么用 你可能...
-
保姆级教程--抢先体验 Microsoft 365 Copilot,微软全家桶Chat GPT
【ChatGPT】前些天发现了一个巨牛的人工智能学习电子书,通俗易懂,风趣幽默,无广告,忍不住分享一下给大家。(点击查看学习资料) 前段时间微软发的Microsoft 365 Copilot 可以说非常火爆了,那么该怎么抢鲜体验呢。今天分享的操作,目前...
-
stable diffusion教程,详细版,包括解决各种问题
前提: 需要环境 git git下载地址Git - Downloading Package 直接装即可 python3.10.6 下载地址 Python Release Python 3.10.6 | Python.org 记得p...
-
QPS提升近10倍!解读飞桨加持下的文心一言满月成绩单
近期,一直犹抱琵琶半遮面的国内各路AI相关厂商,扎堆发布大模型。一时间,百“模”大战,鱼龙混杂。 此前,作为全球第一个正式发布大模型的大厂,百度文心一言的一举一动,成为业界关注的焦点。 就在4月19日,时隔文心一言发布1个月又3天,一张“百度飞桨对文心...
-
Grounding dino + segment anything + stable diffusion 实现图片编辑
目录 总体介绍 总体流程 模块介绍 目标检测: grounding dino 目标分割:Segment Anything Model (SAM 整体思路 模型结构: 数据引擎 图片绘制 集成 样例 其他问题 附录 总体介绍...
-
【OpenAI】DALL·E 2,让我来带你认识一下这位来自AI界的艺术家
个人主页:【?个人主页】 文章目录 前言 什么是DALL-E 2 ? 介绍的怎么厉害,它又能干啥呢? 基本功能 新功能 编辑 变体功能 总结 前言 DALL-E 2 是一种基于语言的人工智能图像生...
-
美女与修狗儿【 InsCode Stable Diffusion 美图活动一期】
女朋友最近买了一只小泰迪,于是给她和修狗儿做一幅画 一、Stable Diffusion 模型在线使用地址 https://inscode.csdn.net/@inscode/Stable-Diffusion 二、模型版本及相关配置 模型:ch...
-
whisper执行ffmpeg时,报错: hp, ht, pid, tid = _winapi.CreateProcess(executable, args, 系统找不到指定的文件。
最近在用openai/whisper-small进行语音转文字任务时,想着自己下载模型在本地离线跑,但是遇到了一下问题: import whisper import wave import numpy as np download_root = r"\...
-
任务14、无缝衔接,MidJourney瓷砖(Tile)参数制作精良贴图
14.1 任务概述 在这个实验任务中,我们将深入探索《Midjourney Ai绘画》中的Tile技术和其在艺术创作中的具有挑战性的应用。此任务将通过理论学习与实践操作相结合的方式,让参与者更好地理解Tile的核心概念,熟练掌握如何在Midjourney...
-
深入理解LLaMA, Alpaca, ColossalChat 系列模型
知乎:紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca:大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...
-
Pycharm配置Copilot一直waiting for github authentication
版本 pycharm版本:2022.1.3社区版 copilot插件版本:1.1.27.1708 问题 安装插件后,login时一直waiting for github authentication。看了一些issue有的回退版本,有的通过fq然...
-
Upscayl:开源AI图像放大增强工具 | AIGC实践
连续写了两篇比较理论的文章——一篇行业思考,一篇技术讨论——可能劝退了很多不明真相的人民群众,一看后台数据,好么…… 马上周末了,今天分享一篇轻松小文,介绍一款开源免费、成熟度高、操作简单、效果显著的开源AI图像放大增强工具——Upscayl。...
-
Stable Diffusion - After Detailer 插件 脸部和手部 重绘算法与应用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131699857 After Detailer 是一个用于 Stabl...
-
大语言模型-中文chatGLM-LLAMA微调
微调大语言模型-ChatGLM-Tuning大语言模型-微调chatglm6b大语言模型-中文chatGLM-LLAMA微调大语言模型-alpaca-lora 本地知识库大语言模型2-document ai解读大语言模型-DocumentSearch解...
-
处理stable-diffusion-webui本地部署过程中的commit hash <none>问题的一个方法
安装webui时一直卡在commit hash none RuntimeError: Couldn't determine Stable Diffusion's hash: 69ae4b35e0a0f6ee1af8bb9a5d0016ccb27e36dc...
-
无需魔法三分钟上线Midjourney应用,【附源码】【示例】
ps:我是标题党,目前还没见过三分钟完成任务的,三分钟只能打通Midjourney接口。我花了一天时间接入应用哈哈哈! 首先,我要感谢laf赞助我,让我可以免费使用Midjourney进行开发和测试。来自白嫖党的快乐。 其次,我要感谢白夜、米开朗基...
-
如何使用 Midjourney?AI绘画应用保姆级教程
一:基础篇 1:注册 首先,你需要注册一个 Discord 账号,然后加入 Midjourney 的 Discord 服务器。或者去 Midjourney 的官网点击右下角的 Join the Beta: 2:在 Discord 公共服务...
-
几种技巧让大模型(ChatGPT、文心一言)帮你提高写代码效率!
代码神器 自从大模型推出来之后,似乎没有什么工作是大模型不能做的。特别是在文本生成、文案写作、代码提示、代码生成、代码改错等方面都表现出不错的能力。下面我将介绍运用大模型写代码的几种方式,帮助程序员写出更好的代码!(大模型包括但不限于ChatGPT、文心...
-
北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点
AI能理解搞笑视频笑点在哪里了。 AI回答:这个视频之所以搞笑,在于一个小宝宝正坐在床上努力读书,但他显然还不会真正读书。他只是不停地指着书页上的各处,而摄影者则在背后笑他。小宝宝的这种尝试很有趣,因为他在尝试阅读一本对他而言过大的书,也看不懂里面的文...
-
阿里云白嫖GPU搭建Stable Diffusion Webui (保姆级教程)
1. 准备条件 1.1 环境搭建(白嫖阿里云GPU资源包) 显卡:VRAM 4GB 以上 (建议使用NVIDIA显卡 内存:建议8G以上 Python版本:>3.10 1.1.1 阿里云先领取资源包 https://free.ali...
-
AI「cosplay」关键在人设!复旦、人大等发布大五人格+MBTI测试:特质还原率达82.8%,拒绝OOC
想和喜欢的动漫小说角色聊天?想要一个虚拟伴侣?想要自己的数字智能体? 随着大语言模型(Large Language Models, LLM)的发展,这些过去的幻想似乎越来越近了。 Character AI、Chat 凉宫春日、病娇AI女友模拟器……基于大...
-
Win11的dev通道更新Build23493版本后启用Windows Copilot的解决办法
博客嘛,多偷懒少打字,先上图: 首先是微软宣布了对dev通道版本推送了Windows Copilot for Windows 11,但是相信像我这样的小白想体验又对win一窍不通的人应该也有不少,经历了一次重装,五次版本的回退再更新后终于...
-
GPT-4不会图形推理?“放水”后准确率依然只有33%
GPT-4的图形推理能力,竟然连人类的一半都不到? 美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。 而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。 △虚线表示16项任务的平均表现 这项实验结果发表后,迅速在...
-
Omniverse Replicator环境配置和使用说明
Omniverse Replicator使用说明 本教程将介绍Omniverse Replicator的环境配置和使用说明, 参加Sky Hackathon的同学可以参考本教程来合成训练数据集. 文章目录 Omniverse Repl...
-
10月份stable diffusion animatediff等插件使用指南,又来更新了
插件一直会更新,包含了基本市面上流行的90%插件,好用的插件更是不会错过,往期插件请看往期文章,如果你没有时间一直关注sd更新的进展,请关注我,一个月用几个小时看一下我的文章,最短时间跟进sd。也算是我的个人笔记 sd插件 sd-webui-ani...
-
深度解析:Stable Diffusion中negative prompt是如何作用的?
Diffusion Models专栏文章汇总:入门与实战 前言:stable diffusion推理的时候可以用negative prompt(负面提示词 去除我们不想出现的元素,这种方法的背后原理是什么?如何用代码实现呢?这篇博客就深入探讨这...
-
中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT
中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型(LLM)。该模型基于封神榜团队的 Ziya2-13B 模型构建,拥有130亿个参数,并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的...
-
【Stable Diffusion】FID、CLIP、cfg-scales都是什么
在stable-diffusion 仓库中,是这样评价模型的。 Evaluations with different classifier-free guidance scales (1.5, 2.0, 3.0, 4.0, 5.0, 6.0, 7....
-
Reno11系列全新支持「闪速抠图」,端侧AI模型赋能高效创作
OPPO今日宣布,Reno11系列支持全新「闪速抠图」功能,基于ColorOS14 端侧AI模型、自研AI加速平台算子优化与算力强大的芯片平台,可带来超越iOS的行业最快反馈速度的「闪速抠图」。离线抠图、一点即完成的无停滞感操作,使Reno11系列以更快速...