-
stable diffusion webui 教程:安装与入门
stable diffusion webui 安装与入门 原理简介 一、源码仓库 二、模型库地址 三、在 Windows 上自动安装步骤 安装Python 安装git 下载源代码 编辑 webui-user.bat 四、如何打开 五、依据文...
-
微软推出AI助手Copilot的正式版本;ChatGPT:七位研究人员分享他们的观点
? AI新闻 ? 微软推出AI助手Copilot的正式版本 摘要:微软宣布其AI助手Copilot正式上线,此前Copilot的预览版已成为很多用户的日常AI伴侣。此次上线后,Copilot将继续提供AI驱动的网络聊天体验,并具备商业数据保护功能,...
-
一文通透位置编码:从标准位置编码、旋转位置编码RoPE到ALiBi、LLaMA 2 Long
前言 关于位置编码和RoPE 应用广泛,是很多大模型使用的一种位置编码方式,包括且不限于LLaMA、baichuan、ChatGLM等等 我之前在本博客中的另外两篇文章中有阐述过(一篇是关于LLaMA解读的,一篇是关于transformer从零实现...
-
AI绘图模型不会写字的难题,被阿里AnyText破解了
能准确写汉字的AI绘图工具,终于登场了! 包括中文在内一共支持四种语言,而且还能文字的位置还能任意指定。 从此,人们终于可以和AI绘图模型的“鬼画符”说再见了。 这款名为AnyText的绘图工具来自阿里巴巴,可以按照指定位置精准地向图中加入文字。 此前的绘...
-
基于Huggingface完成text-to-image的文本生成图像实例(AIGC)--零基础
AIGC指人工智能生成创造力(Artificial Intelligence Generated Creativity,AIGC),是一个涵盖多个领域的跨学科领域,它将人工智能和计算机科学与创造力和艺术结合起来,旨在通过算法生成具有创造力和艺术性的作品,例...
-
AI绘画中采样器用于逐步去噪
介绍 Stable Diffusion 进行 AI 绘画,采样器存在的价值就是从噪声出发,逐步去噪,得到一张清晰的图像。 https://github.com/AUTOMATIC1111/stable-diffusion-webui.git 以下是...
-
win10部署NovelAI绘画,Stable Diffusion,Chilloutmix,实现txt2img,img2img(含调参)
文章目录 1、Stable Diffusion是什么 2、深度学习环境搭建 3、Stable Diffusion环境搭建(可跳过) 4、Stable Diffusion WebUI环境搭建(主要) 5、NovelAI模型的修改与调参 6、Chi...
-
kaggle竞赛-Stable Diffusion数据分析与baseline
你的目的是来预测我们生成图像的提示词 1.比赛目标 这个竞赛的目标不是从文本提示生成图像,而是创建一个模型,可以在给定生成图像的情况下预测文本提示(你有一堆提示词,你预测是否该提示词参与了图像的生成)?您将在包含由Stable Diffusion 2....
-
生成式 AI 没有从 Web 2.0 中学到任何东西:与困扰社交平台的同样问题作斗争
自 OpenAI 在 12 个月前发布 ChatGPT 以来,它不仅创造了消费产品增长最快的记录,也引发了对于新技术的政府干预的快速响应。美国联邦选举委员会正在调查虚假的竞选广告,国会呼吁对人工智能公司如何开发和标记其算法训练数据进行监管,而欧盟则通过了对...
-
抗生素研究新突破!麻省理工用AI发现新抗生素类别 可对抗MRSA
最近,麻省理工大学的科学家们利用人工智能技术取得了突破性的发现,发现了一种新的抗生素类别,用于对抗耐药性金黄色葡萄球菌(MRSA)。60年来的抗生素研究已经有60多年没有取得重要的进展了,这是60年来发现的首个新型抗生素。该研究结果发表在了《自然》杂志上。...
-
OpenAI员工:未来的关键技能不是提示工程,而是与人类沟通的能力
近日,一位OpenAI员工在社交媒体上发表看法称,未来关键的技能不是提示工程,而是阅读、写作和口语。他表示,与人类有效沟通的能力将在2024年成为真正重要的技能,即便是对于那些可能年薪六位数以上的提示工程师。 这位开发者在推特上表示:“热门观点:许多人认为...
-
OpenAI员工:提示词工程技能被夸大,学会和人打交道更重要
12月29日消息,作为提示词工程师,也就是聊天机器人ChatGPT等工具背后引导人工智能模型生成最佳输出的专家,你可能会获得颇为丰厚的报酬。然而OpenAI的一名员工表示,这项技能并不像看起来那么神奇。 本周早些时候,OpenAI的开发者倡导者洛根·基...
-
提高LLaMA-7B的数学推理能力
概述 这篇文章探讨了利用多视角微调方法提高数学推理的泛化能力。数学推理在相对较小的语言模型中仍然是一个挑战,许多现有方法倾向于依赖庞大但效率低下的大语言模型进行知识蒸馏。研究人员提出了一种避免过度依赖大语言模型的新方法,该方法通过有效利用具有不同注释格式...
-
Midjourney V6 引爆社交媒体,AI图像与照片的差别消失;LangChain的2023AI发展状况总结
? AI新闻 ? Midjourney V6 引爆社交媒体,AI图像与照片的差别消失 摘要:Midjourney V6 第二次社区评价震惊网友,神图细节逼真,光影效果逆天,皮肤质感细腻,已超越昨日版本。V6即将上线,预计在圣诞节前发布。其出图质量让...
-
数据闭环!DrivingGaussian:逼真环视数据,驾驶场景重建SOTA
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 北大王选计算机研究所的最新工作,提出了DrivingGaussian,一个高效、有效的动态自动驾驶场景框架。对于具有移动目标的复杂场景,首先使用增量静态3D高斯对整个...
-
李开复:中国大模型竞争异常激烈,最终将有几个大赢家
12月28日消息,根据风险投资家、谷歌中国前总裁李开复的预测,中国的生成式人工智能创业公司正在经历一场“预选赛”。他今年早些时候创立了零一万物(01.AI),这是一家总部位于北京的初创公司,专注于开发大语言模型(LLM)。上个月,该公司完成了一轮融资,...
-
Llama2推理RTX3090胜过4090,延迟吞吐量占优,但被A800远远甩开
大型语言模型 (LLM 在学界和业界都取得了巨大的进展。但训练和部署 LLM 非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的开源框架和方法。然而,不同硬件和软件堆栈的运行时性能可能存在很大差异,这使得选...
-
微软推大模型整合性工具库PromptBench
微软最近推出了一个专门用于评估大语言模型的整合性工具库,名为PromptBench。该工具库提供了一系列工具,包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击等,以支持研究人员从不同方面对LLMs进行评估和分析。 项目地址:https:/...
-
GPT-4 API曝出重大漏洞 一句prompt就能提取私人信息
近日,GPT-4API曝出了安全漏洞,FAR AI实验室的团队通过微调、函数调用和搜索增强等方式成功越狱了这一先进模型。微调方面,通过15个有害样本和100个良性样本的微调,研究人员发现GPT-4在生成内容时可能会放下安全戒备,包括生成错误信息、提取私人信...
-
conda环境下RuntimeError: Couldn‘t determine Stable Diffusion‘s hash问题解决
1 问题描述 在部署stable-diffusion-webui项目时,出现RuntimeError: Couldn't determine Stable Diffusion's hash错误,错误信息如下: [root@localhost stab...
-
科学家开发出BrainGPT:可将思想转化为文本
快科技12月26日消息,据国内媒体报道,澳大利亚悉尼科技大学科学家开发出一种便携式、非侵入性的人工智能读心”头戴设备BrainGPT,可将思想转化成文本。 据了解,BrainGPT把脑电波信号分割成不同的单元,从中捕获特定的特征和模式。模型通过从大量脑电数...
-
量子人工智能研究中的挑战与机遇
量子计算和人工智能的融合催生了量子人工智能,这是一个具有巨大前景和潜力的研究前沿。随着研究人员深入这一未知领域,遇到了一系列独特的挑战和机遇,这些挑战和机遇决定了进步的轨迹。本文将探索量子人工智能研究的动态格局,研究研究人员面临的障碍以及随着其推动传统计...
-
量子人工智能的实践:现实世界的应用和用例
量子人工智能的实践:现实世界的应用和用例 优化问题 量子计算机的关键优势之一在于,其比经典计算机更有效地处理优化问题的能力。物流、金融和制造业等行业每天都在努力应对复杂的优化挑战。量子人工智能算法可以为路线优化、投资组合管理和供应链物流等问题找到最...
-
打造「专属arXiv」!德国高校顶级视觉团队推出「论文定制化」推荐系统,免费开放
10毫秒生成一张图像,1分钟6000张图像,这是什么概念? 下图中,就可以深刻感受到AI的超能力。 图片 甚至,当你在二次元小姐姐图片生成的提示中,不断加入新的元素,各种风格的图片更迭也是瞬间闪过。 图片 如此惊人的图片实时生成速度,便是来自UC伯克利、...
-
研究表明 ChatGPT 提供的建议,比专家更全面、更有帮助
12 月 26 日消息,专家近期展开的一项研究表明,ChatGPT 所提供的建议,相比较人类专家提供的回复更平衡、更全面、更善解人意、更有帮助。 来自墨尔本大学和西澳大利亚大学的研究团队从十大热门建议栏网站上,随机挑选了 50 个社会困境问题。 该科...
-
单张4090,1秒100张二次元小姐姐!UC伯克利等新模型霸榜Github,吞吐量提升近60倍
10毫秒生成一张图像,1分钟6000张图像,这是什么概念? 下图中,就可以深刻感受到AI的超能力。 甚至,当你在二次元小姐姐图片生成的提示中,不断加入新的元素,各种风格的图片更迭也是瞬间闪过。 如此惊人的图片实时生成速度,便是来自UC伯克利、日本筑波大学...
-
一文读懂常用的 “生成式 AI 库”
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - GenerativeAI Library(生成式 AI 库) ,本文将继续聚焦在针对 Gen AI Library 的技术进行解析,使得大家能够了解 G...
-
2023年GenAI技术应用趋势观察
生成式人工智能(GenAI)正处于技术创新的前沿,为各个行业变革发展带来新的可能性。然而,随着这些技术的不断应用与整合,企业组织也必须谨慎对待其应用安全性和监管合规,以负责任和可持续的方式实现GenAI技术的价值落地。日前,专业媒体Helpnetsecu...
-
谷歌Bard更新中文支持;GPT-4:1.8万亿参数、混合专家模型揭秘; Meta推出商用版本AI模型
? AI新闻 ? 谷歌的AI聊天工具Bard更新,增加中文支持 摘要:谷歌的AI聊天工具Bard新增中文环境,用户可以使用简体和繁体中文进行交流。然而,与竞品相比,Bard的回复略显生硬,语义理解还有待提升。此外,谷歌还更新了Bard的日志页面,新...
-
与AI聊天如此费水!2027年全球AI耗水预计将达66亿立方米
根据央视财经的报道,当用户向ChatGPT提出10到50个问题时,可能会消耗掉500毫升的水。这一数据揭示了AI技术发展对水资源需求的增长趋势。 据数据显示,AI所需的算力正以惊人的速度增长。每100天,AI所需要的算力就会翻倍,预计在未来五年内将增长超过...
-
研究发现:GPT-3经常出错,重复有害的错误信息
一项新研究发现,OpenAI的ChatGPT等大型语言模型经常重复阴谋论、有害的刻板印象和其他形式的错误信息。 图源备注:图片由AI生成,图片授权服务商Midjourney 最近的一项研究中,加拿大滑铁卢大学的研究人员系统地测试了ChatGPT对六个类别...
-
李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%
思维链(CoT),最具开拓性和影响力的提示工程技术之一,能增强LLM在推理决策中的表现。 那么,如果大模型可以在代码中「思考」,会如何呢? 最近,谷歌DeepMind、斯坦福、UC伯克利团队联手提出了全新技术——「代码链」(CoC)。 论文地址:htt...
-
阿里团队推新AI模型I2VGen-XL:单张静止图像就能生成高质量视频
视频合成最近取得了显著的进步,这得益于扩散模型的快速发展。然而,它在语义准确性、清晰度和时空连续性方面仍然存在挑战。它们主要源于文本-视频数据的稀缺性和视频的复杂固有结构,使得模型难以同时确保语义和定性的卓越性。 阿里巴巴、浙江大学和华中科技大学的研究人员...
-
苹果开放 AI 研究成果,发布多模态 LLM 模型 Ferret
IT之家 12 月 25 日消息,苹果公司于 2023 年 10 月与哥伦比亚大学的研究人员合作发布了名为 Ferret(雪貂)的开源多模态 LLM,但当时并没有引起太多关注。 许多人工智能社区的人士都错过了 Ferret 的发布,他们对苹果意想不到地...
-
LLaMA 简介:一个具有 650 亿参数的基础大型语言模型 官网介绍
2023 年 2 月 24 日 更新:我们刚刚推出了Llama 2 - 有关最新信息的更多信息,请参阅我们关于 Llama 2 的博客文章。 作为 Meta 致力于开放科学的一部分,今天我们公开发布 LL...
-
AI绘画中CLIP文本-图像预训练模型
介绍 OpenAI 在 2021 年提出了 CLIP(Contrastive Language–Image Pretraining)算法,这是一个先进的机器学习模型,旨在理解和解释图像和文本之间的关系。CLIP 的核心思想是通过大规模的图像和文本对进行...
-
零一万物回应「抄袭 LLaMA」;京东原副总裁试用可穿戴人工喉丨 RTE 开发者日报 Vol.85
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的...
-
CMU权威对比Gemini,GPT-3和Mistral8×7B!GPT-3.5依旧拿捏Gemini,开源模型差距依然不小
谷歌最近发布的Gemini掀起了不小的波澜。 毕竟,大语言模型领域几乎是OpenAI的GPT一家独大的局面。 不过作为吃瓜群众,当然希望科技公司都卷起来,大模型都打起来! 所以,作为科技巨无霸谷歌的亲儿子,Gemini自然承受了很高的期待。 虽然Gemi...
-
谷歌创始人亲自给Gemini写代码,很核心那种
身价1050亿美元,每天还在亲自动手敲代码!? 就连谷歌最新大招Gemini大模型的核心贡献者名单中,也有他的名字。 没错,他就是谷歌联合创始人谢尔盖·布林(Sergey Brin)。 千亿富翁大老板亲自下场敲代码已是少见,更何况频率是“几乎每天”,这事...
-
中国团队又获超导重大突破!类LK-99材料展现超导性,可重复可验证
室温超导又有新进展? 由华南理工大学,中南大学,电子科大的研究人员12月19日在Arxiv上发表论文,宣布他们在新合成材料CSLA上测到了具有显著抗磁性磁滞回线的低场微波吸收,通过不断转动磁场方向可以令这个现象减弱直至消失。 根据团队说法,没有哪种磁性会...
-
量子计算凛冬将至,LeCun:现实冷酷,炒作太多
「量子计算,寒冬将至了?」 本周五,AI 先驱 Yann LeCun 的一番言论引发了人们的讨论。 这位 AI 领域的著名学者表示,量子计算正在进入一个艰难时刻。与此同时,很多科技领域专家认为,目前的量子计算技术进步很多趋向于炒作,距离实际应用仍然很遥...
-
史上最快3D数字人生成器:半小时完成训练,渲染仅需16毫秒,苹果出品
之前要两天才能训练好的数字人,现在只用半小时就能完成了! 到了推理阶段,更是只要16毫秒,就能得到动作流畅、细节到位的场景视频。 而且无需复杂的采样和建模,只要随便拍一段50-100帧的视频就足够了,换算成时间不过几秒钟。 这正是由苹果联合德国马普所推出...
-
【LLM】LLaMA简介:一个650亿参数的基础大型语言模型
LLaMA简介:一个650亿参数的基础大型语言模型 Paper Setup 其他资料 作为 Meta 对开放科学承诺的一部分,今天我们将公开发布 LLaMA (大型语言模型 Meta AI ,这是一个最先进的大型语言基础模型,旨在帮...
-
Anthropic发布新方法 通过提示降低生成式AI偏见
人工智能公司Anthropic最近发布了一项方法,旨在通过提示工程减少公司使用的大型语言模型(LLMs)输出中的歧视。该公司在一份文件中详细介绍了一种评估方法,指导公司如何通过优化提示降低模型输出的歧视性。该文件为开发人员和决策者提供了了解LLMs生成答案...
-
一个算命准确度高达78%的AI,让网友都当上了赛博阎王
咱中国人爱算命这事,是刻在骨子里的执念。 出门前要看看黄历、办公室要讲风水、就连谈恋爱换工作也要算算领导和对象的星座和八字合不合适。 算命姿势也是无奇不有,用八字星座塔罗牌已属过去式,寺庙求签不够潮。 这不,有位中国人就在ChatGPT上训练了一个“算命专...
-
研究人员开展侵袭性前列腺癌AI检测研究
加利福尼亚大学洛杉矶分校(UCLA)健康琼斯顿综合癌症中心的研究人员获得了一项为期五年的500万美元资助,以开展侵袭性前列腺癌的人工智能(AI 检测研究。这项由美国国家癌症研究所提供的资金旨在识别新的癌症生物标志物,并发展AI技术,用于检测和预测侵袭性前列...
-
23年生成式AI全球投资超360亿!开发者预测2024年LLM应用进入大爆发
2023年11月30日,ChatGPT庆祝了它的生日,Similarweb发布了下面这张精美的信息图来纪念这一时刻。 从ChatGPT诞生,到2023年5月,它的访问量一直在迅速增长,峰值达到了每月18亿次的访问量。 随后,客流量在6月有所下降,但自9...
-
浙大“北极熊毛衣”登Science,保温效率达羽绒服5倍
最近,一波又一波寒潮接踵而至,羽绒服成了人们过冬的必备物品。 而浙大研制了一种新型材料,不仅保暖而且比羽绒服更轻薄耐用,论文已经登上了Science。 它模仿了北极熊毛的结构,仅用五分之一的厚度,就能达到和羽绒一样的保暖效果。 图片 这款“北极熊毛材料”...
-
研究揭示:谷歌Gemini Pro在基准测试中落后于免费ChatGPT
根据卡内基梅隆大学的最新研究报告,谷歌最新推出的大型语言模型Gemini Pro在基准测试中未能达到预期水平,不仅落后于GPT-3.5,还远远不及GPT-4。 Gemini Pro的研究结果与谷歌在Gemini发布会上所提供的信息相矛盾,凸显了对中立基准测...
-
2023 年最重要的 3 项人工智能创新:多模态 AI、宪法 AI 和文本转视频技术
2023 年,人工智能(AI)领域见证了重大进展,不仅公众对 AI 有了更深的理解,政府也开始认真对待 AI 风险。本年度的发展不仅是新技术和理念的出现,更是长期孕育后的集中爆发。 以下是过去一年中人工智能领域最重要的三项创新: 多模态 AI(Mul...