-
内测挤爆的文心一言,能否迎战GPT-4?
2月7日,百度宣布推出ChatGPT类型人工智能产品“文心一言”,并于3月份完成内测向公众开放。一个多月后的今日,在北京百度总部和上海张江人工智能岛,文心一言如期而至。 百度董事长兼CEO李彦宏介绍,文心一言在商业文案创作、数理推算等方面有突出能力,同时...
-
构建生成式人工智能需要的不仅仅是大模型
生成式人工智能(GenAI 的迅速崛起使得企业争相寻找新的创新方法来利用这项技术在商业应用中的力量。许多企业认为,大型语言模型(LLM 已经重塑了人工智能驱动的商业应用程序的构建方式,所需要的只是将数据输入到大型企业的LLM模型中,它就会完成工作。然而,...
-
美图自研AI视觉大模型MiracleVision发布4.0版本
今日,美图自研AI视觉大模型MiracleVision(奇想智能)发布4.0版本,最新版本带来了两大新能力:AI 设计和 AI 视频。 AI 设计包括四大功能:矢量图形、文字特效、智能分层和智能排版。用户可以通过 AI 设计快速生成匹配设计风格的矢量图形,...
-
手机ai绘画软件哪个好?这些绘画软件值得你收藏
ai绘画是最近非常流行的一种绘画方式,大家可以根据描述或者关键词和图片结合生成绘画作品,最重要的是ai绘画还拥有多种绘画风格可以供大家进行使用,同时绘画后的作品也可以进行自由的保存或者是二次更改。那一定有小伙伴会问,手机可以ai绘画软件有哪些呢?该...
-
NLP(自然语言处理)任务必备:六个顶级Python库推荐
本文将介绍用于自然语言处理任务的6个最佳Python库。无论是初学者还是经验丰富的开发人员,都能从中获得启发和帮助,提升在NLP领域的实践能力。 1. Pynlpir Pynlpir是一个非常优秀的 Python 中文自然语言处理库。它提供了一系列功能...
-
海艺官网体验入口 AI艺术创作软件app免费下载地址
《海艺》是一个全民艺术创作平台,用户可以在平台上发现创意、捕捉灵感并即刻创作。它提供丰富的模型和训练工具,拥有强大的图像处理能力和智能创作算法,用户可以轻松地创建、分享和生成艺术作品。那么,《海艺》在哪里可以体验呢?下面就给大家带来《海艺》官网体验入口和免...
-
全球四大会计师事务所在审计中部署AI,辅助初级员工处理复杂任务
事实表明,AI在金融服务领域的应用正在迅速增长,而会计行业的知名公司正在寻求部署这项技术的新方法。 据报道,作为审计业务的一部分,安永开始使用AI帮助发现欺诈行为。在这一消息传出之际,全球四大会计师事务所也在部署AI,帮助初级员工完成更复杂的任务,这表明...
-
BlurOn软件官方体验入口 AI自动马赛克软件哪个好
BlurOn是一款使用NTT Data的AI技术的插件,能够在视频中自动识别脸部、头部、全身、车牌等元素,并以高达99.7%的精度自动添加马赛克和模糊效果。该插件操作简便,安装后即可使用,即使是新手也可以轻松上手。这一功能在电视节目制作、自动驾驶开发、医疗...
-
游戏革命2023:AIGC拯救游戏厂商
文明史即工具史,纵观人类社会的演化,每一次的加速迭代,都有赖于关键性的技术突破。 前有蒸汽机到电力普及的生产力大爆发,以及计算机、互联网的诞生打开新世界,如今AIGC将再次推动先进技术工具的变革。 随着ChatGPT的爆火,AIGC已成内容创作...
-
没有数据智能的人工智能是人工的
å¾ç 你在工作中看过机器人吸尘器吗?它一开始很有趣,当你看到它错过了你想要它清洗的一块污垢时,它变得越来越恼人。人工智能的前景是一样的。它可以使日常工作自动化,并带来显著的实际价值;但如果你不小心,你可能会花大部分时间反复撞到同一面墙上,或者在第...
-
办公员工普遍认为生成式AI对老板更有益而非雇员工
在办公人员中,对于生成式人工智能(AI)的态度存在显著分歧,一项由科技公司Ivanti发布的调查显示,办公室员工普遍认为生成式AI更有利于雇主而非雇员。该 公司发布的“AI革命报告”揭示,尽管许多公司正在迅速采用AI,但办公室员工对先进AI的承诺并不完全买...
-
百度文心一言(千帆大模型)聊天API使用指导
开篇不得不吐槽下百度,百度智能云平台首页跳转千帆大模型平台的按钮太多了,不同按钮跳转不同的子页面,不熟悉的,能把人找懵。入口太多,就导致用户不知道从何开始。本文就从一个前端开发人员的角度,教大家快速使用上文心一言(千帆大模型)API。 直接进千帆控制...
-
OpenAI的首席运营官谈论ChatGPT的发布、开发人员日和奥特曼的想法
OpenAI的首席运营官Brad Lightcap在接受记者采访时表示:“如果你知道奥特曼,他喜欢在一个话题上快速切换,所以我们在一个话题上花了这么多时间意味着这件事很重要。这是一场辩论——人们并不100%确定这是正确的事情,或者是值得我们花时间...
-
AI入侵B站鬼畜区!网友辣评:不如传统“活字乱刷术”
11月27日,B站UP主“女孩为何穿短裙”突破传统,投稿一则使用AI合成语音制作的鬼畜视频,标志着AI视频制作正式进入B站鬼畜区。视频播放量截至目前已达167.3万,获得14.5万的点赞和2.8万个投币。 鬼畜视频一直以其独特之处引起关注,其精彩之处在于通...
-
stable-diffusion基础问题记录
一、windows安装 1、启动 如果自己是anaconda,python版本不是3.10.6 conda create -n python_3_10_6 python=3.10.6,创建一个这样的环境 修改webui-user.bat set P...
-
Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办
现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构,成为有力挑战者,引起大量关注: Mamba(曼巴,一种蛇),在语...
-
Runway和Getty宣布合作开发新生成式AI视频模型RGM
Runway ML与Getty Images宣布合作开发新的生成式AI视频模型,命名为Runway Getty Images Model(RGM),旨在服务好莱坞和广告行业。 RGM不仅仅是一个视频模型,更是为企业提供的基准模型,企业可以在其基础上构建自己...
-
whisper技术部署及简单使用
文章目录 安装ffmpeg(解压模式 安装python(源码编译模式) 安装pytorch 安装whisper whisper命令行使用 python调用whisper pip包离线导出安装 whisper是openai开源的...
-
让3D编辑像PS一样简单,新算法GaussianEditor在几分钟内完成3D场景增删改
3D 编辑在游戏和虚拟现实等领域中发挥着至关重要的作用,然而之前的 3D 编辑苦于耗时间长以及可控性差等问题,很难应用到实际场景。近日,南洋理工大学联合清华和商汤提出了一种全新的 3D 编辑算法 GaussianEditor,首次实现了在 2-7 分钟完...
-
Clipchamp AI旁白生成器 免费为视频添加专业的画外音
Clipchamp AI文字转语音生成器是一款免费在线工具,通过人工智能技术,为视频添加专业的画外音。用户可以选择400多个逼真的声音,涵盖不同年龄、口音、性别和中性音调,以满足各种品牌和需求的要求。支持170多种语言,包括西班牙语、意大利语、日语、韩语、...
-
MidJourney笔记(4)-settings
前面已经大概介绍了MidJourney的基础知识,后面我主要是基于实操来分享自己的笔记。可能内容顺序会有点乱,请大家理解。 这次主要是想讲讲settings这个命令。我们只需在控制台输入/settings,然后回车,就可以执行这个命令。...
-
“离谱的AI扩图”火了!张张那叫一个出其不意
家人们,真的是要被抖音AI扩图给笑死了—— 主打一个看完让人“意想不到”、“一肚子气”~ 例如一对恩爱情侣的照片在AI扩图前是非常有信仰感的: △素材来源:抖音@快乐野人 但在AI扩图一通“神操作”之下,画风简直是180度大反转: △素材来源:抖音...
-
Runway和Getty合作开发新生成式AI视频模型RGM 瞄准好莱坞和广告行业
Runway ML与Getty Images的合作标志着AI视频领域的重要进展。这次合作将开发一个新的生成式AI视频模型,命名为Runway Getty Images Model(RGM),专注于服务好莱坞和广告等视觉媒体行业。 RGM的独特之处在于,它将...
-
AI 绘画用 Stable Diffusion 图生图局部重绘功能给美女换装(这是我能看的嘛)
昨天带大家一起装好了 Stable Diffusion 的环境,今天就来带大家一起体验一下 Stable Diffusion 的局部重绘功能。 没装好环境的可以看上一篇:AI 绘画基于 Kaggle 10 分钟搭建 Stable Diffusion(保姆...
-
性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型
最近,InflectionAI发布了全新的一款AI模型。 更炸裂的是InfectionAI对这款模型的评价——性能直超谷歌和Meta开发的两款模型,紧随OpenAI的GPT-4之后。 到底是什么样的表现让InflectionAI能夸下如此海口呢? 在介绍...
-
艺术家集体诉讼AI公司侵权新进展 新增被告Runway
艺术家集体对三家AI公司提起的侵权诉讼有了新的进展。 原本由三名艺术家Sarah Anderson、Kelly McKernan和Karla Ortiz提起的诉讼,法官在十月份对其中一项侵权指控作出了裁决,令律师团队进行修订。针对法院的关切,律师们提出了修...
-
中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用
“ Meta 开源 LLAMA2 后,国内出现了不少以此为基座模型训练的中文模型,这次我们来看看其中一个不错的中文模型:Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中,比较有名的是Meta的LLAM...
-
Nvidia计划在日本建立半导体工厂网络以满足AI需求
Nvidia首席执行官黄仁勋宣布了一项雄心勃勃的计划,即在日本建立一系列半导体工厂,以满足对人工智能图形芯片不断增长的需求。这一举措是与日本公司的紧密合作,旨在支持先进人工智能应用的图形芯片需求。 在与日本经济大臣西村康稔进行富有活力的对话中,Huang强...
-
AI抠图使用指南:Stable Diffusion WebUI Rembg实用技巧
抠图是图像处理工具的一项必备能力,可以用在重绘、重组、更换背景等场景。最近我一直在探索 Stable Diffusion WebUI 的各项能力,那么 SD WebUI 的抠图能力表现如何呢?这篇文章就给大家分享一下。 安装插件 作为一个生成式AI,S...
-
Mozilla 让人们将 AI LLM 变成单文件可执行文件,简化大型语言模型的分发和运行
供本地使用的 LLM(大型语言模型)通常作为一组权重分布在数 GB 文件中。这些软件不能直接单独使用,这通常使得它们比其他软件更难分发和运行。给定的模型也可能经历了更改和调整,如果使用不同的版本,则会导致不同的结果。 Mozilla 的创新团队最近发布了...
-
【极客技术】真假GPT-4?微调 Llama 2 以替代 GPT-3.5/4 已然可行!
近日小编在使用最新版GPT-4-Turbo模型(主要特点是支持128k输入和知识库截止日期是2023年4月)时,发现不同商家提供的模型回复出现不一致的情况,尤其是模型均承认自己知识库达到2023年4月,但当我们细问时,Fake GPT4-Turbo(暂且这...
-
AI视频聊天应用Call Annie 随时随地和AI视频聊天
近期,一款名为Call Annie的AI视频聊天应用正变得异常火爆。通过这个应用,用户可以与一个名叫Annie的虚拟女性进行视频通话。这个应用是由OpenAI旗下的ChatGPT模型驱动的,而这个模型可以听懂各种各样的语言,并能实时与用户进行英语语音交流。...
-
文心一言-适用的精美 prompt-调教手册
文心一言简介 文心一言是百度推出对标chatGPT的产品,也是国内大厂首个发布的大模型语言类产品。文心一言知识增强大语言模型百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、...
-
AI大模型,如何破圈而出?
一年即将过去,回望整个2023,我们会觉得这是一个毫无疑问的“AI大模型之年”。这一年里,全球兴起了数百个大模型。根据相关报道,仅仅在中国就有超过200个大模型,形成了名副其实的“百模大战”。 但有个问题不知道大家注意到没有?大模型虽多,但真正用到大模型的...
-
在m1/m2芯片的mac电脑上运行Stable Diffusion的全步骤
最近开源社区里最火的项目肯定有Stable Diffussion一个席位。作为一个AI通过文本描述绘画的开源项目,其优秀的生成结果和极快的生成速度也让它在AI绘画项目中一夜封神。 不过遗憾的是,这类AI项目要在苹果公司的自研芯片m1/m2上运行有点麻...
-
澳大利亚政府成立AI版权参考小组,应对人工智能与版权挑战
澳大利亚政府于周二宣布成立一个专注于版权与人工智能问题的参考小组,以解决随着生成式AI技术迅速增长而出现的最大问题之一。 澳大利亚总检察长马克·德雷弗斯于周二宣布了这一参考小组的成立,该小组将协助联邦政府更好地应对由人工智能的增加使用所带来的未来版权挑战。...
-
向“创新者”升阶,程序员当下如何应对 AI 的挑战 | 京东云技术团队
随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色正在经历深刻的变革,我们不得不重新对自己进行审视和思考。 通用领域大模型的“泛化能力” 在过去的二十年内,AI 领域的大部分研究和应用都集中在完成一项特定的任务中,例如:分类图片、总结...
-
Stable Diffusion绘画系列【2】:二次元风美女
《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ ?感谢小伙伴们点赞、关注! 《------往期经典推荐----...
-
谷歌称重复某些关键词可让ChatGPT自曝训练数据 OpenAI:违反服务条款
12月5日消息,谷歌的一组研究人员声称,他们已经找到了获取OpenAI人工智能聊天机器人ChatGPT部分训练数据的方法。 在最新发表的论文中,谷歌研究人员表示,某些关键词可迫使ChatGPT泄露其所接受训练数据集的部分内容。 他们举例称,该模型在被提...
-
审计机构Marcum推出AskMarcum.ai,搭载微软Azure OpenAI服务
Marcum 作为全美最大的会计和咨询公司之一,日前发布了AskMarcum.ai,这是一款由微软Azure OpenAI服务支持的工具,旨在提高团队的工作效能。这一创新工具由Marcum技术创新孵化器Marcum Labs开发,已经嵌入在Microsof...
-
LoRA微调stable diffusion models:原理和实战
Diffusion Models专栏文章汇总:入门与实战 前言:AIGC大模型(如stable diffusion models 的训练成本已经超过绝大多数人的承受范围,如何利用已有的开源大模型,花费较小的成本微调出属于自己的专有模型?现在微调...
-
OpenAI 首席运营官:不要期待人工智能一夜之间带来实质性的商业变革
12 月 5 日消息,虽然 OpenAI 正努力发展企业用户,然而,该公司的一些高管提醒人们,不要期望这项技术能迅速改变他们的业务。 在接受 CNBC 采访时,OpenAI 首席运营官 Brad Lightcap 表示,人工智能最被过度炒作的部分之一就...
-
OpenAI竞争对手Mistral融资近5亿美元,估值达20亿美元,获英伟达和Salesforce支持
彭博社最新报道显示,Mistral AI 正在筹集近5亿美元资金,最终阶段的投资中包括来自英伟达公司和Salesforce公司等重要投资者。这轮融资将Mistral AI的估值推至约20亿美元,使其成为OpenAI的强大竞争对手。 图源备注:图片由AI生...
-
LLMs之LLaMA-2:源码解读(tokenizer.py文件)基于SentencePiece库执行文本的分词和编码/解码操作—在文本生成和处理过程中,将文本字符串与token ID列表之间进行相互
LLMs之LLaMA-2:源码解读(tokenizer.py文件 基于SentencePiece库执行文本的分词和编码/解码操作—在文本生成和处理过程中,将文本字符串与token ID列表之间进行相互转换,以便与深度学习模型进行交互 目录...
-
NeuRAD: 用于自动驾驶的神经渲染(多数据集SOTA)
论文"NeuRAD: Neural Rendering for Autonomous Driving",来自Zenseact,Chalmers科技大学,Linkoping大学和Lund大学。 神经辐射场(NeRF)在自动驾驶(AD)社区中越来越受欢迎。最...
-
亚马逊面向企业的 AI 聊天机器人 Amazon Q 或存在严重幻觉和数据泄露问题引发质疑
在发布不到一周后,Amazon Q —— 亚马逊对抗 Copilot 的生成式 AI 助手——已面临生存威胁,一份新报告显示这款 AI 助手可能产生「严重幻觉」。 据 The Platformer援引泄露文件报道,Q 正面临准确性和隐私问题,包括幻觉和数...
-
微调语言大模型选LoRA还是全参数?基于LLaMA 2深度分析
本文对比了全参数微调和LoRA,并分析了这两种技术各自的优势和劣势。作者使用了三个真实用例来训练LLaMA 2模型,这提供了比较特定任务的性能、硬件要求和训练成本的基准。本文证明了使用LoRA需要在serving效率和模型质量之间做出权衡,而这...
-
微软向 30 亿人推出免费的 Seeing AI 应用:帮助盲人和低视力群体了解周围环境
在国际残疾人日这一特殊的日子,微软发布新闻稿宣布,微软最新的人工智能技术驱动下的 Seeing AI 应用程序最新版本现已推出,并首次在 Google Play 商店提供安卓版下载。借助今天的安卓版本发布,Seeing AI 现已支持 18 种语言,并计划...
-
生成式对抗网络(GAN)原理推导与网络构建思路
0 引言 设想这样的场景:你是一个工作室的老板,你的工作室主要用来生产名画的赝品;而真正的名画则为前人所创造,存放在收藏室中。你的赝品画会和真品画一起被鉴定家鉴定,而你的终极目标是成为一个以假乱真的工艺大师。通往目标的路自然十分坎坷,你首先要做的就是以...
-
Llama 2 云端部署与API调用【AWS SageMaker】
Meta 刚刚发布了 Llama 2 大模型。如果你和我们一样,你一定会迫不及待地想要亲自动手并用它来构建。 推荐:用 NSDT设计器 快速搭建可编程3D场景。 使用任何类型的 LLM 进行构建的第一步是将其托管在某处并通过 API 使用...