-
AIGC专栏9——Scalable Diffusion Models with Transformers (DiT)结构解析
AIGC专栏9——Scalable Diffusion Models with Transformers (DiT)结构解析 学习前言 源码下载地址 网络构建 一、什么是Diffusion Transformer (DiT 二、DiT的组成...
-
苹果取消电动车计划,转向聚焦生成式AI
在近期的一份内部声明中,苹果首席运营官Jeff Williams和电动车项目负责人Kevin Lynch宣布取消自动驾驶电动车计划,将大部分从事该项目的2,000名员工调往生成式AI项目。这一决定意味着苹果将把重心转向生成式人工智能领域。 据悉,苹果的AI...
-
百度发布2023年第四季度财报 李彦宏:继续坚定对生成式AI投入
百度公布了其2023年第四季度及全年的财务报告,全年总营收高达1345.98亿元,同比增速达39%,归属百度的净利润(non-GAAP)为287亿元,同样实现了显著增长。 在第四季度,百度的营收达到了349.51亿元,同比增长44%,净利润(non-GAA...
-
ChatGPT大战Copilot,谁才是最强王者
巨人之战:GitHub Copilot vs ChatGPT ⚔️⚔️ 微信搜索关注《Java学研大本营》,加入读者群,分享更多精彩 ChatGPT的发布在编程社区引起了波澜,因为它可以产生令人难以置信的代码片段。 它与去年发布的GitHub...
-
[AIGC] Tomcat:一个简单 and 高效的 Java Web 服务器
Tomcat(Tomcat Server)是 Apache 基金会下的一个开源项目,它是一个简单 and 高效的 Java Web 服务器,支持 Servlet 2.5、JSP 2.2 和 EL 2.2 规范。Tomcat 是当今最受欢迎的 Java We...
-
苹果将终止十年电动汽车计划“泰坦” 团队转向生成式AI
据外媒报道,苹果公司本周在内部宣布,将终止代号“泰坦”的电动汽车计划,团队将专注于研究生成式AI。 苹果暂未对此做出评论。马斯克在社交媒体上以敬礼和抽烟表情包评价这一传闻。 据悉,该项目由近2000名员工参与,历时十年之久,目的是为苹果进入汽车行业。然...
-
LLaMA v1/2模型结构总览
LLaMA v1/2模型结构总览 孟繁续 目录 收起 结构 Group Query Attention(V2 only RMSNorm SwiGLU RoPE llama2 出来了,并且开源可商用,这下开源社区又要变天了。快速...
-
Ubuntu环境中Stable Diffusion的roop插件安装(8.12更新)
roop插件是一款换脸神器,可以在Stable Diffusion中实现一键换脸,现在已经有了基于automatic1111的web-ui开源项目上的插件。 windows版本上的安装教程已经很多了,这边就不说了。下面是ubuntu中的安装过程。 1....
-
使用websocket后端接入文心一言
最近再写项目练手,想着最近大模型那么火,也想接入项目来玩一玩,于是去了解了一下相关的api和通信协议,最后选择了文心一言进行集成,国内的相对稳定。ERNIE-Bot-turbo - 千帆大模型平台 | 百度智能云文档 (baidu.com 使用webs...
-
真快!几分钟就把视频语音识别为文本了,不到10行代码
大家好,我是风筝 将音视频文件中的音频转为文字内容,这个需求放到两年前还不大好实现,但是放到今天,几分钟就解决了。 听说有的公司为了抓取训练数据,已经把抖音、快手这些短视频平台上的视频扒了个遍,然后将其中的音频提取成文本,用作大数据模型的训练语料。 如果...
-
龙年大吉——AIGC生成龙年春联
?龙年大吉——AIGC生成龙年春联? 前言 公众号:【可乐前端】,期待关注交流,分享一些有意思的前端知识 时间过得好快,一眨眼2024年就来了。这两年对互联网冲击最大的想必就是大语言模型的AIGC能力了。从国外的GPT到国内的文心一言、...
-
AIGC实战——扩散模型(Diffusion Model)
AIGC实战——扩散模型 0. 前言 1. 去噪扩散概率模型 1.1 Flowers 数据集 1.2 正向扩散过程 1.3 重参数化技巧 1.4 扩散规划 1.5 逆向扩散过程 2. U-Net 去噪模型 2.1 U-Net 架构 2.2...
-
Stable Diffusion学习指南【安装篇】
在上一篇的教程中,我为大家介绍了Stable Diffusion的原理、发展历程和优点,大家应该对Stable Diffusion这款AI绘画工具有了初步的了解,而这一篇我将教你如何在自己电脑上轻松部署WebUI。 Stable Diffusion历史文...
-
选择最适合数据的嵌入模型:OpenAI 和开源多语言嵌入的对比测试
OpenAI最近发布了他们的新一代嵌入模型embedding v3,他们将其描述为性能最好的嵌入模型,具有更高的多语言性能。这些模型分为两类:较小的称为text- embeddings -3-small,较大且功能更强大的称为text- embeddin...
-
动手实践丨轻量级目标检测与分割算法开发和部署(RK3568)
本文分享自华为云社区《自动驾驶(AIOT - 轻量级目标检测与分割算法开发和部署(RK3568 【玩转华为云】》,作者:HouYanSong。 本文将在ModelArts平台上开发轻量级目标检测与分割算法,并使用ModelBox框架在RK3568开发板...
-
Diffusion-Client官网体验入口 安卓AI图像生成软件免费使用地址
Diffusion-Client是一个功能强大的Stable Diffusion客户端,专注于图像生成。它提供了文本到图像、图像到图像、图像修复等多种功能,并内置控制网调节生成效果。该APP还支持历史记录管理、标签提取等高级功能,同时可以扩展插件,连接到C...
-
基于AIGC的BI系统项目知识点挖掘与回顾
项目后端项目技术栈:SSM+Spring Boot、Redis、RabbitMQ、MySQL、MyBatis-Plus、Hutool工具库。 Spring Boot是基于Spring框架的Java开发框架,简化了Spring的搭建和配置。该框架可用于快...
-
webassembly003 whisper.cpp的python绑定实现+Cython+Setuptools
python绑定的相关项目 官方未提供python的封装绑定,直接调用执行文件 https://github.com/stlukey/whispercpp.py提供了源码和Cpython结合的绑定 https://github.com/zh...
-
补齐Transformer规划短板,田渊栋团队的Searchformer火了
最近几年,基于 Transformer 的架构在多种任务上都表现卓越,吸引了世界的瞩目。使用这类架构搭配大量数据,得到的大型语言模型(LLM)等模型可以很好地泛化用于真实世界用例。 尽管有如此成功,但基于 Transformer 的架构和 LLM 依然难...
-
这款对标ChatGPT的国产MoE大模型重磅更新!集AI对话、AI绘画、AI阅读、AI写作于一体!
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效...
-
干货满满!大神Karpathy两小时AI大课文字版第一弹,全新工作流自动把视频转成文章
前段时间,AI大神Karpathy上线的AI大课,已经收获了全网15万次播放量。 当时还有网友表示,这2小时课程的含金量,相当于大学4年。 就在这几天,Karpathy又萌生了一个新的想法: 那便是,将2小时13分钟的「从头开始构建GPT分词器」的视频...
-
如何用 AI绘画摆摊赚钱, 月入5w+秘密公开!
在上海年会上,展示了AI头像定制服务,吸引了众多朋友的兴趣。本文将提供详细的操作流程,掏心大坦白的从0-1详细的告诉大家。 盈利分析: 一晚上 40个客户 人均30左右,最后营收1165。成本主要就是摊位费+制作成本,制作成本极低。 从地摊情...
-
荣耀魔法大模型、任意门亮相MWC2024:AI体验远超iPhone
快科技2月25日消息,今晚MWC 2024展会正式揭晓,荣耀成为首个亮相并召开重磅发布会的中国厂商。 荣耀联合世界生态伙伴带来超越iOS的流畅体验,联合高通、Meta将70亿参数大模型引入端侧,带来了超越iOS的智慧体验。 此前在国内发布的MagicOS...
-
20240202在WIN10下部署faster-whisper
20240202在WIN10下部署faster-whisper 2024/2/2 12:15 前提条件,可以通过技术手段上外网!^_ 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2...
-
曝苹果正在测试类似于OpenAI AI聊天机器人ChatGPT的工具"Ask"
苹果正在测试类似于OpenAI旗下AI聊天机器人ChatGPT的工具"Ask" 随着ChatGPT和谷歌旗下AI聊天机器人Bard的兴起,几乎所有科技公司都努力在人工智能领域分一杯羹。然而,与OpenAI、微软和谷歌等其他公司相比,苹果在人工智能方面的步伐...
-
数学建模比赛中,使用大语言模型如chatgpt、文心一言该如何写Prompt(提示)?
在大型语言模型中,"prompt"(中文常译为“提示”或“引导”)是指提供给模型的输入文本,用于指示或引导模型产生特定的输出。它的作用主要是告诉模型用户想要得到什么样的信息或完成什么样的任务。 例如,在使用大型语言模型进行文本生成时,你可以输入一个问题、...
-
苹果试点类ChatGPT工具Ask 帮助客服回答用户问题
苹果正在试点推进一款名为Ask的类ChatGPT工具,旨在帮助其AppleCare客服团队更有效地回答用户的技术问题。 据悉,这款Ask工具具备强大的功能,能够自动生成相关的操作步骤、疑难解答等内容。当用户向客服团队提出技术疑问时,客服人员可以直接参考As...
-
苹果正在内部测试类ChatGPT工具Ask:可根据内部数据库信息自动生成答案
2月23日消息,据外媒报道,苹果正在内部测试一款类似于OpenAI旗下AI聊天机器人ChatGPT的生成式人工智能(AI)工具,该工具名为“Ask”,可以根据苹果内部数据库信息自动生成答案。 随着ChatGPT和谷歌旗下AI聊天机器人Bard的兴起,几乎所...
-
百度副总裁:靠AI赚钱是今年重点
近日,百度集团高级副总裁、移动生态业务群组(MEG)负责人何俊杰公布了2024年第一季度的目标与关键成果(OKR 。其核心目标为:通过引领AI行业的发展,重构具有代表性的应用场景,以实现盈利增长。 在2023年,随着文心一言的正式发布,百度CEO李彦宏提出...
-
人脸识别要完?首个“人脸劫持“银行木马诞生
多年来,生物识别技术被宣传为终极身份验证手段,因为每个人的面部、指纹和虹膜信息都独一无二且难以被伪造。然而,随着人工智能技术的井喷式发展,生物识别技术,尤其是人脸识别技术正面临巨大威胁。 近日,网络安全公司Group-IB发现了首个能够窃取人脸(识别数...
-
OpenAI回应“ChatGPT发疯”问题:token预测是根源
近期,ChatGPT意外发生失控事件,用户纷纷报告收到混乱而令人震惊的回复,引起Reddit、HN等社交平台上广泛的讨论。OpenAI迅速做出回应,确认问题源于「token预测」,并表示已成功修复。 ChatGPT用户在向模型提问时,突然发现其回复变得毫无...
-
ChatGPT Team VS Genmini Pro VS 文心一言3.5,ChatGPT到底有多强大?
写在前面 本人只支持GPT-4.0,所以没管谷歌和百度的事(因为它们免费用户也能生成图片) ChatGPT 键盘快捷键 询问版本号 生成图片 写代码 <dependencies> <...
-
腾讯会议·AI小助手体验入口 视频会议AI软件app免费下载地址
腾讯会议·AI小助手是腾讯自主研发的一款会议软件,提供视频会议、网络研讨会、会议室等产品和服务,支持桌面客户端、移动端等多端使用。可实时共享屏幕,支持白板互动等,实现高清音视频会议。还提供开放API,可深度定制开发。适合企业员工在线会议、网络课堂、远程面试...
-
ChatGPT突然疯了,意外输出震惊网友!OpenAI官方回应:token预测是根源
ChatGPT突然疯了!失去理智!精神错乱! ——一大批ChatGPT用户炸了锅。 周二,「ChatGPT发疯」各种讨论话题纷纷刷榜Reddit,HN等各大社交平台。 网友表示,「我收到了ChatGPT有史以来最诡异的回复」。 随后,OpenAI...
-
创意无限:用Midjourney探索Icon设计的奇妙世界-对比v6和v5版本
所有的提示词,gzh:七哥的AI日常 hello,大家好,欢迎回来。 在数字世界中,app应用程序已成为我们日常生活中不可或缺的一部分,一个精心设计的app图标是吸引用户注意力并留下深刻印象的关键。 app图标的形状对其识别度和记忆度起着至关重要的作...
-
Stable Diffusion WebUI常用Tag收集
捆绑(nsfw *可以直接加人物lora Masterpiece, high quality, beautiful wallpaper, 16k, animation, illustration, positive perspective, perf...
-
GitHub Copilot(包括Github Copilot Chat)的使用
目录 1.在Pycharm下载GitHub Copilot插件 2.使用Github账号授权 3.使用GitHub Copilot 3.1 接受或者拒绝代码建议 3.2 查看下一个建议 3.3 接受部分建议 3.4 根据注释生成代码建议 4...
-
2024年Midjourney 付费订阅流程 | Midjourney 各版本介绍,使用虚拟信用卡支付买Midjourney流程指南
1.Midjourney介绍 Midjourney 是一款备受欢迎的人工智能生成图像工具,它可以通过输入文字描述,自动生成精美的图像。与许多其他图像生成工具不同,Midjourney 不需要安装任何软件,也不受个人电脑性能的限制,因为它运行在云端服务...
-
AGI一年之内就会到来,人类只有5年时间了?
OpenAI开年抛出Sora,让全世界都倍感震撼。 年前还在说大模型是茶叶蛋的周鸿祎,看到来势汹汹的Sora,马上改口: 「AGI从10年的时间一下缩短到1年了。」 图片 面对以天为单位不断迭代的技术浪潮,科技大佬们不用担心自己的生计,能继续谈笑风生。...
-
世界模拟器才是AGI终局,12态势预测!首席专家万字长文专业解读Sora里程碑
这几天反复看Sora的技术报告,以及各方对Sora的技术分析。 基本三个角度:惊呼强大功能,分析Sora(实现)大法,评估巨大冲击。 冲击方面,主要关注点在于对影视、短视频、娱乐等领域的影响。 但是,Sora改变AI认知方式,开启走向「世界模拟器」的史诗...
-
Llama深入浅出
前方干货预警:这可能是你能够找到的最容易懂的最具实操性的学习开源LLM模型源码的教程。 本例从零开始基于transformers库逐模块搭建和解读Llama模型源码(中文可以翻译成羊驼 。 并且训练它来实现一个有趣的实例:两数之和。 输入...
-
详解面向 Java 开发人员的机器学习案例
译者 | 陈峻 审校 | 重楼 自去年以来,诸如ChatGPT 和 Bard之类的大语言模型已将机器学习提升到了一种现象级的地位。开发人员使用它们在辅助编程方面不断探索了从图像生成到疾病检测等领域的应用案例。 鉴于全球各大科技公司都在加大针对机器学习的...
-
F5引领AI时代应用安全新变革
圣何塞—2024 年 2月20日—F5(NASDAQ:FFIV)近期在首届应用安全和应用交付大会AppWorld上宣布推出多项新功能,旨在降低保护和支持应用和API的复杂性,而这些呈现爆炸性增长的应用和API正是现代数字体验的核心。 随着AI加速应用及其...
-
Gemini一眼识破Sora视频是AI生成?百万token上下文能力碾压GPT-4
当谷歌Gemini 1.5,遇上抢了它头条的「罪魁祸首」Sora会怎么样? 这两天,拿到内测资格的AI圈大佬们,纷纷给广大网友来了一波在线测试。 这不,Gabor Cselle就让Gemini 1.5去分析了那个著名的樱花雪景视频。 对此,Gemini...
-
【AIGC】Stable Diffusion的常见错误
Stable Diffusion 在使用过程中可能会遇到各种各样的错误。以下是一些常见的错误以及可能的解决方案: 模型加载错误:可能出现模型文件损坏或缺失的情况。解决方案包括重新下载模型文件,确保文件完整并放置在正确的位置。 依赖项错误:Stable...
-
【AI大模型应用开发】0.1 百度文心一言 API接入详细步骤和简单应用
大家好,我是【同学小张】。持续学习,持续干货输出,关注我,跟我一起学AI大模型技能。 最近我的OpenAI的API key由于调用次数太多被封了… 不知道下个月能不能解封。而为了尽可能地不花钱,先来看下国内的大模型API怎么用。 本文是 百度文心一...
-
【AI绘画】Stable Diffusion教程——图生图
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) “图生图”是 Stable Diffusion的 核心功能之一,它的主要能力是根据现有的图片 + 提示词生成新的改造...
-
有道ai写作,突破免费限制,无限制使用
预览效果 文末提供源码包及apk下载地址 有道ai写作python版 import hashlib import time import json import ssl import base64 import uuid from urlli...
-
机器学习中的十种非线性降维技术对比总结
降维意味着我们在不丢失太多信息的情况下减少数据集中的特征数量,降维算法属于无监督学习的范畴,用未标记的数据训练算法。 尽管降维方法种类繁多,但它们都可以归为两大类:线性和非线性。 线性方法将数据从高维空间线性投影到低维空间(因此称为线性投影 。例子包括...
-
政安晨:演绎在KerasCV中使用Stable Diffusion进行高性能图像生成
小伙伴们好,咱们今天演绎一个使用KerasCV的StableDiffusion模型生成新的图像的示例。 考虑计算机性能的因素,这次咱们在Colab上进行,Colab您可以理解为在线版的Jupyter Notebook,还不熟悉Jupyter的的小伙伴可以...