-
AI在咳嗽中检出癌症,不信?世卫组织正全球推广
中国的AI技术,登上联合国了! AI for Good峰会是联合国在AI领域的旗舰峰会,今年,联合国秘书长古特雷斯、“深度学习三巨头”之一的Hinton,以及OpenAI CEO奥特曼等都来参会了。 这样一场盛会中,一位中国女性患者吹奏口琴的视频吸引了全...
-
这家产品AI用户过亿,月活第一,覆盖学习办公和家庭教育,还有人偷偷用来赚钱
谁是AI产品风口浪尖最当红的焦点? 不是有些盆友猜测的聊天Bot——在最新的AI产品榜上,百度文库才是高居榜首的那一位。 显眼的排名背后,是超1.4亿的AI用户数,以及超15亿的AI新功能使用次数。 AI能用它帮大忙的场景,遍布学习办公、家庭教育和兼职赚...
-
稳定扩散美学梯度(Stable Diffusion Aesthetic Gradients):一种创新的图像生成技术...
稳定扩散美学梯度(Stable Diffusion Aesthetic Gradients):一种创新的图像生成技术 项目地址:https://gitcode.com/vicgalle/stable-diffusion-aesthetic-gradien...
-
国产大模型全阵容,中文大模型竞技场推出!
LMSYS Org推出的大模型竞技场Chatbot Arena,已成为海外最具公信力的大模型榜单之一,但该榜单中文化程度相对不足。近日,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿...
-
OpenAI被曝帮苹果Siri换脑,微软急了:CEO约谈奥特曼
OpenAI、苹果被曝牵手成功,iPhone要变AiPhone了! 预计苹果将在6月10日的WWDC2024上首发iOS18的新AI功能,到时见分晓。 知情人士透露,Siri很可能会被AI彻底改造,可控制应用程序内的所有功能。 The Informati...
-
Midjourney 和 Dall-E 的优劣势比较
Midjourney 和 Dall-E 的优劣势比较 Midjourney 和 Dall-E 都是强大的 AI 绘画工具,可以根据文本描述生成图像。 它们都使用深度学习模型来理解文本并将其转换为图像。 但是,它们在功能、可用性和成本方面存在一些差异。...
-
音乐界的GPT免费!Suno v3.5全部开放,歌曲长达4分钟!未来敲敲塑料壶就能成天籁
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) Suno清晨干大事,宣布此前只对高级版和专业版用户开放的v3.5版本,所有用户都可用了! 图片 简单说,Suno生成的歌曲变长了也变强了。 作为音乐界的Cha...
-
快手可图大模型Kolors完全指南:AI艺术创作工具 - 使用方法教程与免费体验入口
探索快手可图大模型Kolors能为你带来哪些改变 为什么选择快手可图大模型Kolors? 快手可图大模型Kolors不仅仅是一款产品——它是一项革命性的技术,致力于将人工智能与艺术创作相结合。通过这项技术,Kolors旨在为设计师、艺术家、内容创作者和普...
-
使用llama.cpp量化部署LLM
以llama.cpp工具为例,介绍模型量化并在本地部署的详细步骤。这里使用 Meta最新开源的 Llama3-8B 模型。 1 环境 系统应有make(MacOS/Linux自带)或cmake(Windows需自行安装)编译工具 Python 3....
-
武汉市民点赞无人驾驶,市交通运输局:与头部企业共创智能网联汽车产业新蓝图
“武汉市注重智能网联汽车产业发展,已陆续开放智能网联汽车开放道路超千公里,鼓励智能网联汽车头部企业入驻武汉,携手共创武汉智能网联汽车产业发展新蓝图。百度萝卜快跑作为自动驾驶行业中的领军企业,重视武汉智能网联汽车产业发展,从2022年8月落户武汉经开区以来...
-
AI内容创作开卷,为什么百度文库成为超强玩家?
大语言模型发展至今,对各行各业的赋能程度越来越深,一些代表性产品正在改变甚至颠覆着整个行业。 简单回顾便能发现,ChatGPT 引领了一场文本创作革命、Stable Diffusion 等文生图大模型降低了绘画门槛、视频大模型 Sora 令影视从业者感到恐...
-
aigc 启动器 sd-webui-aki-v4 decode_base64_to_file
下载地址: SD-WebUI启动器 绘世-启动器 | 万物档案 decode_base64_to_file报错: File "E:\BaiduNetdiskDownload\stable diffusion\sd-webui-aki-v4\e...
-
Novita AI开源Animate Anyone项目 上传一张照片即可合成动画
阿里巴巴的一个项目,利用一张图片和提取视频中的人物姿势合成角色动画,现在被Novita AI开源并提供了API。用户只需提供一张照片和一个参考视频,即可通过API接入合成动画。该项目名为Animate Anyone,灵感来源于MooreThreads/Mo...
-
产品经理的AI秘籍:从AIGC到大模型,让你笑傲智能时代
文章目录 @[TOC](文章目录 前言 一、什么是AIGC? 二、什么是大模型 2.1 大模型特点 2.2 大模型里程碑——Transformer的发布 2.2.1 Transformer通俗解释 2.2.2 基于Tran...
-
You.com推自定义助手功能,允许用户自行创建个性化AI助手
总部位于帕洛阿尔托的初创公司You.com今天宣布推出“自定义助手”,这是一项突破性的功能,允许用户使用GPT-4o、Llama3和Claude3等顶级语言模型 (LLM) 创建个性化的 AI 助手,所有功能都在一个界面内完成。对话式 AI 的这一重大飞跃...
-
【AIGC调研系列】llama 3与GPT4相比的优劣点
Llama 3与GPT-4相比,各有其优劣点。以下是基于我搜索到的资料的详细分析: Llama 3的优点: 更大的数据集和参数规模:Llama 3基于超过15T token的训练,这相当于Llama 2数据集的7倍还多[1][3]。此外,它拥有40...
-
Motionshop完全指南:AI视频编辑工具 - 使用方法教程与免费体验入口
探索Motionshop能为你带来哪些改变 为什么选择Motionshop? Motionshop不仅仅是一款产品——它是一项革命性的技术,致力于将视频中的人物自动转换为3D卡通角色。通过这项技术,Motionshop旨在为视频内容创作者、社交媒体用户和...
-
央视的AI动画《AI我中华》宣传视频,原来用AI工具Stable Diffusion制作,竟然这么简单?
大家好,我是向阳。 前段时间,央视的《爱我中华》AI宣传短片火爆全网,有一个穿越转场效果非常惊艳!先来回顾回顾: 今天就先来详细讲解,如何利用Stable Diffusion制作这样的穿越转场视频。 如你还没有安装Stable Diffusion,...
-
缓解字节 AI 焦虑的超级应用:剪映 or 豆包?
张一鸣把抖音最重要的两个人物,都放在AI相关的核心位置。 今年2月,OpenAI发布视频生成模型Sora过去9天后,张楠放下抖音CEO的位置,聚焦剪映。看上去这是一个舍大取小的举动,甚至有被流放之嫌。事实是,和陈林当初负责教育业务一样,张楠在为字节攻克新高...
-
Midjourney指南 - 生成高分辨率图片(内容已更新至V5)
Midjourney 首先为每个作业生成一个低分辨率图片网格(2x2 。你可以在选择其中任一图片,使用 Midjourney upscaler 来增加尺寸并添加更多细节。有多种可用于放大图像的放大模型。 每个图像网格下方的按钮用于放大所选图像。U1 ...
-
Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天?
Cartesia 发布了一个名为 Sonic 的低延迟语音生成模型,该模型以其快速的推理速度和超低的延迟引起了广泛关注。Sonic 的延迟仅为135毫秒,能够生成具有逼真情感和表达能力的语音。用户只需提供10秒的录音,Sonic 即可模仿说话者的韵律、语调...
-
什么ai写作软件好用?这篇文章告诉你
你们知道吗?现在写作不再是单一的脑力劳动,而是可以借助ai的力量,让创作变得更加高效和有趣! 无论是需要快速生成初稿、校对语法,还是寻求创意灵感,ai写作工具都可以帮助我们快速搞定!那么,你们想知道ai写作简写软件有哪些吗?今天,就让我们一起探索7款顶尖...
-
CIO可以做的三件事,使GenAI与可持续性同步
去年,随着许多CIO首次准备进行范围3(Scope 3 报告,GenAI几乎渗透到了每一个办公室。有时它是通过正门进来的,但在大多数情况下,它是悄悄渗入的,因为知识工作者在编写文档和电子邮件时试验了它,而不一定承认他们在这样做。 在许多企业中,使用案...
-
苹果或将允许Siri控制APP所有功能 此前已与OpenAI达成合作
科技界资深分析师马克·古尔曼(Mark Gurman)最新爆料,苹果公司正积极筹划一场Siri语音助手的彻底革新。这一改革将利用最先进的人工智能技术,赋予Siri前所未有的能力,让用户能够首次通过Siri控制应用程序中的所有功能。 此次Siri的升级,关键...
-
ai写作绘画对话,ai文章,真心好物分享,500多模型,用过的都说好
500+模型,生成质量也是相当好。 用过的都得跪谢我=!=小小鸟ai...
-
Spring Boot与百度AI语音识别API集成实践
本专题系统讲解了如何利用SpringBoot集成音频识别技术,涵盖了从基础配置到复杂应用的方方面面。通过本文,读者可以了解到在智能语音填单、智能语音交互、智能语音检索等场景中,音频识别技术如何有效提升人机交互效率。无论是本地存储检索,还是云服务的集成,丰...
-
Kinetix 和 Overdare 将生成式 AI 交到游戏玩家手中
Kinetix是一家为视频游戏创建用户生成表情 (UGE) 的生成 AI 初创公司,近日,宣布与韩国出版巨头Krafton旗下的用户生成内容(UGC)平台Overdare达成合作,这一合作标志着生成AI技术首次直接交到了游戏玩家的手中,预示着游戏体验新时代...
-
Stable Diffusion AI绘画:从创意词汇到艺术图画的魔法之旅
文章目录 一、Stable Diffusion的工作原理 二、从提示词到模型出图的过程 三、Stable Diffusion在艺术创作中的应用 《Stable Diffusion AI绘画从提示词到模型出图》 内容简介 作者简介 楚天 目录...
-
分分钟完成Excel任务的十大AI工具
译者 | 布加迪 审校 | 重楼 通过无缝集成Python和各种人工智能(AI 工具,Excel的功能正在迅速发生转变,彻底改变了工作节奏。 去年,微软宣布了Python集成的公开预览版,Excel因此迎来了重大升级。这意味着开发人员和数据分析师不再需...
-
美国军方向Palantir拨款 4.8 亿美元,推动AI技术军用
美国国防部最近向数据处理公司 Palantir 拨款4.8亿美元,旨在加速将其 Maven AI 战斗代码引入整个国防部。这笔合同是由五年内提供高达4.8亿美元的 Maven 智能系统(MSS)原型开发所签署的,国防部希望 Palantir 在2029年前...
-
AI绘画SD入门教程:文生图基础用法(提示词)
大家好,我是程序员晓晓 今天我们来实践一下,通过提示词(prompt)的输入,让SD生成我们满意的图片。在生成图片前,我们先了解下提示词的基础原则,有了这些知识能迅速帮助各位同学构建出自己的提示词。 !基本原则! 首先,我来介绍下写提示词的基本原...
-
麻省理工科技评论称:数据是生成式AI的基础
预训练的大型语言模型(LLM)如 GPT-4和 Gemini 备受组织关注,他们渴望利用 LLM 构建聊天机器人、副驾驶等应用。根据麻省理工科技评论的最新报告,名为 “C 级领导人的 AI 准备情况”,该报告是代表 ETL 供应商 Fivetran 进行的...
-
LLMs之RAG:只需四步骤—基于Ollama后端框架(配置phi3/LLaMA-3模型)结合Dify前端框架(设置知识库文件+向量化存储+应用发布)创建包括实现本地知识库问答/翻译助手等多个应用
LLMs之RAG:基于Ollama后端框架(配置phi3/LLaMA-3模型 结合Dify前端框架(设置知识库文件+向量化存储+应用发布 创建包括实现本地知识库问答/翻译助手等多个应用 目录 基于Ollama后端框架(配置phi3/LLaMA-...
-
盘点近一年大火的AI滤镜,聊聊创作爆款AI内容的规律
以前的滤镜:纯欲风、胶片感、海盐风、奶茶风…… 现在的滤镜:小羊肖恩黏土人、游戏NPC即视感、莫奈的画…… 上传一张照片,等待数秒,就可以轻松将其转化为不同风格的视觉作品,过程中伴随着未知和惊喜感,当然也可能会“翻车”。 这就是近一年来,让无数网友沉迷的新...
-
学业辅导导师:文心一言智能体详细介绍和开发
一、前言 本期题目 开发方向:学习成长类 解读: AI技术在学习成长方向的应用正日益增多,本期赛题需围绕该方向开发智能体包括但不限于:作文辅导助手、个性化学习助手、考试助手、各垂类教育内容专家等 二、我的智能体:学业辅导导师 在这个快节奏的...
-
Opera浏览器宣布接入端侧AI大模型
5月29日,昆仑万维旗下海外信息分发与元宇宙平台Opera宣布,其旗舰浏览器Opera One以及游戏浏览器Opera GX将正式接入端侧AI大模型,成为全球第一个接入端侧AI大模型的主流浏览器。 据悉,2024年4月,Opera已通过AI Featur...
-
刚刚!Stable diffusion 4.7+ComfyUI升级版终于来了!(一键安装包,感谢大佬)
「 无套路!文末提供免费下载 」 如果这个世界有上帝,那么祂一定是程序员。 国内SD绘画启动器第一人是我认为是B站的秋葉aaaki 因为制作了这款Stable Diffusion启动器,降低了国内使用SD的门槛且分文不收,秋叶被粉丝戏称赛博菩萨。...
-
【最新】生成式人工智能(AIGC)与大语言模型(LLM)学习资源汇总
基本概念学习 a Andrej Karpathy 的 - 大型语言模型简介:https://www.youtube.com/watch?v=zjkBMFhNj_g 该视频对 LLMs 进行了一般性和高级的介绍,涵盖推理、缩放、微调、安全问题和提示注入...
-
使用文心一言快速构建思维导图
使用文心一言快速构建思维导图 1.打开文心一言 2.勾选插件 3.上传需要解析的文档或论文 4.上传文档完成后会自动解析文章的内容,再次与其对话(请根据此文献,帮我创建一个markdown的思维导图,要求尽可能详细,但是,一般回答的依旧计较简单...
-
GitHub Copilot Workspace:欢迎进入原生Copilot开发环境
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同...
-
【LLAMA3超级课堂-第四节】Llama 3 高效部署实践(LMDeploy 版)
开发机地址:https://studio.intern-ai.org.cn/console/instance 本文内容 环境,模型准备 LMDeploy chat LMDeploy模型量化(lite LMDeploy服务(serve 环...
-
啥,字节扣子Bot通过API调用百度文心一言?
4月1号扣子上新啦!! 扣子插件在线IDE 扣子丰富的插件功能和灵活的Workflow深受开发者的好评,这不,扣子又推出了插件IDE,无需使用自己的IDE、无需使用自己的服务器就可以更好的写自己的插件(之前已经支持在Worflow中直接添加代码节点)。...
-
x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别
介绍 Whisper 模块通过 whisper.cpp 帮助用户快速将音频转换为文字。 INFO: whisper.cpp 是一个用 C/C++ 编写的轻量级智能语音识别库,是基于 OpenAI 的 Whisper 模型的移植版本,旨在通过深度...
-
新手必看!AI绘画Stable Diffusion图生图详解,一文看懂秒变AI绘画大神!
大家好,我是程序员晓晓 本文主要分为四部分: 1. 图生图原理 2. 图生图流程介绍 3. 随机种子Seed的应用 4. 图生图应用场景 我们上篇文章里面讲了 Prompt 提示词原理,也顺带使用「文生图」结合 Prompt 提示...
-
LLaMa系列模型详解(原理介绍、代码解读):LLaMA 3
LLaMA 3 2024年4月18日,Meta 重磅推出了Meta Llama 3,Llama 3是Meta最先进开源大型语言模型的下一代,包括具有80亿和700亿参数的预训练和指令微调的语言模型,能够支持广泛的应用场景。这一代Llama在一系列行业标...
-
AIGC: 4 IT从业者如何构建自己的AI知识体系
图片是我使用dall.e模型生成的图片, 提示词: 程序员系统学习OpenAI开发者平台系统学习。 我按照SCQA模型,来开始今天的内容。 S 场景 今天是2024年3月23日,我在深圳,从事IT行业,每个人从事的行业各不相同, 但是都在被AI冲...
-
浅浅探讨一下AIGC技术的发展现状和未来趋势
AIGC(Artificial Intelligence Generated Content)即人工智能生成内容,是利用生成式人工智能来自动创作文本、图像、视频等内容的技术。(文末有福利,站长总结了网上比较流行的AI工具,整理分类后分享的~) 以...
-
如何看待AIGC技术?未来已来,请做好准备!
文章目录 前言 令人震撼 无限可能 核心优势 背后力量 双刃剑 总结 前言 我正在写一篇关于人工智能对人类工作影响的文章,突然,我的电脑屏幕上弹出一条消息:“嘿,伙计,介意让我写一点吗?” 我吓了一跳,然后意识到是我自己的...
-
北航发布LlamaFactory,零代码大模型微调平台,一键快速实现大模型训练/微调/评估
“LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models” 在大模型发展如火如荼的今天,训练和微调一个大模型对于绝大部分普通工程师来说仍然是一个难题。为了降低大模型训练、...
-
大模型应用开发之业务架构和技术架构(从AI Embedded 到 Copilot,再到Agent)
前言 本文我们重点讲的就是伴随着大模型的广泛应用,这些概念是在什么体系和场景下衍生的;换句话说,基于LLM,目前大家在做的应用,他主流的业务架构和技术架构都是什么样子的,我们在了解之后,可以根据依据我们现实的业务需求,来选择自己的技术路线。 技术往...