-
4名MIT学霸两年造AI编程帝国,撼动全球2600万开发者!成立2年估值4亿美金
【新智元导读】4名MIT本科生创业,才两年公司就已经估值4亿美元。开发AI编码助手Cursor的Anysphere,最近在A轮融资中已经筹集超6000万美元。而且,这是一家只有12人的公司。AI编程助手,就是行业的下一个风口? MIT学生创业,仅凭12人的...
-
AI、AGI、AIGC与AIGC、NLP、LLM,ChatGPT区分
这些术语和技术都是人工智能(AI)领域的重要组成部分,它们之间有复杂的关系和相互交织的依存。以下是它们之间的关系和各自的定义: AI(人工智能): 定义:AI是指能够执行通常需要人类智能才能完成的任务的系统。这包括感知、推理、学习、决策和自...
-
AI公文写作哪家强?2024年4款最强AI公文写作工具推荐-附深度测评
AI公文写作哪家强?2024年4款最强AI公文写作工具推荐-附深度测评 随着AI技术的发展,体制内写材料任务的逐渐加重,AI公文写作已经不是什么新鲜事,作为1名在材料岗工作有七八年的文字工作者来说,写材料是一件每天都要面对的事情。自从chatgp...
-
Karpathy狂赞AI代码神器Cursor,直言回不到3年前无辅助编码了,却被指「带货」
热衷于开课并与网友分享新技术使用心得的 AI 大牛 Karpathy,也有被质疑「为推销某个产品而在言论中夹带私货」的一天。 这是怎么一回事呢? 昨天,Karpathy 分享了自己结合使用 AI 代码编辑器与大模型的心得体验,并发出了由衷的感叹:编程领域变...
-
Datawhale夏令营第四期——从零入门AI生图AIGC方向 task1笔记总结
#目录# 一、夏令营内容介绍 适宜学习人群 学习内容提要 二、挑战赛介绍 比赛要求 样例 三、跑通...
-
stable diffusion和GAN网络的区别,优点缺点是什么
稳定扩散(stable diffusion)和生成对抗网络(GAN)是两种不同的深度学习方法。 稳定扩散是一种无监督学习方法,用于图像超分辨率重建。它基于扩散过程模型,通过在不同的时间步骤中对图像进行重建来增加分辨率。该方法能够有效地增加图像的细节,并产...
-
小红书塞进了AI宠物,可我还是更想念十几年前的QQ企鹅。
继QQ养QQ宠物小企鹅,支付宝种树养小鸡之后。 小红书也可以养宠物了,还是AI版的。。。 这几天我刷小红书,冒出来了好多个画风清奇的帖子。 我找了半天,才找到入口,真的,入口贼难找。 你需要搜索“宠物小伙伴”或者从小红书合作推广帖子下的链接才进得去。...
-
Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测
AI圈,再次开卷图像生成。 一连串进展扎堆: 8月21日,Ideogram正式推出2.0版本,声称文本渲染能力更强。 没错,就是那个成立于去年8月,由谷歌AI绘画4大牛集体离职创业的项目,曾获得过一众AI大佬投资。 此番Ideogram还公开叫板Flux,...
-
AI绘画工具Stable Diffusion+ComfyUI的配置
ComfyUI 是一个基于图形用户界面的开源工具,用于搭建和运行复杂的图像生成和处理工作流。它主要围绕使用 Stable Diffusion 模型来生成高质量的图像。这种工具通常允许用户通过拖放不同的模块或节点,定义数据处理和生成流程,然后通过这些流程生成...
-
AI搜索是否能引领信息检索的创新与变革
引言 2024年,人工智能(AI)时代正以前所未有的速度发展。例如,OpenAI推出的Sora模型能够根据文本描述生成视频,震惊了业界;卡内基梅隆大学研究人员发布的基准测试大大提升了大模型在Web上的性能。这些技术创新和突破展示了AI在...
-
Datawhale AI夏令营第四期 魔搭-AIGC方向 task02 精读代码,实战进阶
今天我们的任务是对baseline的代码有一个更加细致的理解,然后我们会学习如何借助AI来提升我们的自学习能力,从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔,你可以从中学大模型的提问技巧来实现快速学习,学会如何制作一个话剧连环画...
-
微软工程师工资曝光!AI部门平均270万远超其他部门
快科技8月25日消息,据媒体报道,数百名微软员工自愿分享了他们的薪资和晋升信息,其中包括超过500名美国员工的详细数据。 分析这些数据后发现,微软软件工程师的平均薪酬范围很广,从148436美元到1230000美元不等,对应着从Level 59到Level...
-
Datawhale AI夏令营第四期AIGC方向Task2学习笔记
Kolors(可图)模型 Kolors是由快手团队开发的大规模文本到图像生成模型(可图 · 模型库 (modelscope.cn )根据链接的文章内容,Kolors在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面,显著优于开源和专有...
-
【AIGC】FaceChain:发挥生成式内容的无限可能性
基于图像生成的个性化肖像框架 摘要 FaceChaine提供了一系列的生成方案,通过少量的图像输入,就能生成逼真的个性化肖像。它是一个个性化肖像生成框架,包含丰富的人脸感知相关的模型,例如人脸检测,深度人脸向量提取,人脸属性分析等等。输入主要的肖像...
-
AIGC从入门到实战:涌现:人工智能的应用
AIGC从入门到实战:涌现:人工智能的应用 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词:AI生成内容、涌现现象、应用案例、技术挑战、未来展望 1. 背景介绍 1.1 问题...
-
Datawhale X 魔搭 AI夏令营(AIGC Task3)学习笔记
目录 认识ComfyUI 1. 什么是 ComfyUI 2. ComfyUI 核心部件 3. ComfyUI 图片生成流程 4. ComfyUI 的优势 使用ComfyUI 下载ComfyUI: 运行ComfyUI: 自我学习: LOR...
-
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【新智元导读】就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了! Transformer...
-
2024年国内版AI写作对话工具推荐
以下排名随意编排,无先后。 提高工作效率的AI神器? | 国内版 笔尖AI写作 能写文案、读文献、互动答疑,多场景写作模板,不限于某个领域,12+种职位的 100+ 工作场景,10秒即可生成一篇专业文章。 推荐指数⭐⭐⭐⭐ 豆包 聊天机器人、写...
-
You.com 希望区别于谷歌成为解决复杂工作查询的 AI 搜索引擎
计算机科学家 Richard Socher 早在斯坦福大学攻读博士学位时就构思了 You.com,但在 2009 年至 2014 年间,由于谷歌的统治地位,Socher 选择暂时搁置这一概念。 随着提示工程的发展——即为生成式 AI 工具创建输入以生成所...
-
AIGC:clip-interrogator
文字生成图片是近年来多模态和大模型研究的热门方向,openai提出的CLIP提供了一个方法建立起了图片和文字的联系,但是只能做到给定一张图片选择给定文本语义最相近的那一个,实际项目开发中我们总是需要从一张图片获取描述,clip-interrogator应运...
-
无需抠图!AI绘画直接文本生成透明底图层,设计师必看的ComfyUI透明图层生成工作流教程!(附插件模型)
大家好,我是画画的小强 AI 绘画自出现以来一直都在不断发展完善,实现了很多我们在实际应用中迫切需要的功能,比如生成正确的手指、指定的姿势、准确的文本内容等。上周,又一个重磅新功能在开源的 SD 生态内实现了——直接通过文本直接生成透明底图像和图层!这将...
-
部署本地语音聊天机器人:在Seeed Studio reComputer Jetson上部署Riva和Llama2
本地语音聊天机器人:在Seeed Studio reComputer Jetson上部署Riva和Llama2 所有教程都免费开源,请动动小手点个小星星https://github.com/Seeed-Projects/jetson-examples...
-
超越SD3,比肩MJ v6,文生图模型FLUX.1开源
近日,图片生成模型FLUX.1引爆了AIGC社区,其在视觉质量、图像细节和输出多样性等方面性能优越,输出极佳的图片生成效果。 FLUX.1系列模型由Black Forest Labs开源,创始人Robin Rombach是Stable Diffu...
-
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
【导读】 适逢Llama 3.1模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型或RAG系统的微调生成合成数据。 Epoch AI上个月刚刚发文[预言数据墙」迫近,结果英伟达转头就甩出了340B开源巨兽Ne...
-
【LLM】一、利用ollama本地部署大模型
目录 前言 一、Ollama 简介 1、什么是Ollama 2、特点: 二、Windows部署 1.下载 2.安装 3.测试安装 4.模型部署: 5.注意 三、 Docker部署 1.do...
-
智能语音生成会议纪要的神器
嘿,技术爱好者们,今天我想分享一个令人兴奋的智能语音项目。它巧妙地结合了faster-whisper、Pyannote以及一系列先进的大语言模型,旨在为会议纪要的自动化生成带来新的可能。 开发了一个智能语音生成会议纪要的神器 在线体验:智能语音...
-
华为Mate 60/X5、Pocket 2新增重磅功能:支持AI消除了 拍照神器
快科技8月24日消息,华为李小龙今天晒图展示了AI消除功能,并表示华为Mate 60系列、华为Mate X5、华为Pocket 2三款老机型都已经新增支持。 据悉,该功能此前仅限于Pura 70系列、nova 12 Ultra星耀版、nova Flip三款...
-
【课程总结】day24(上):大模型三阶段训练方法(LLaMa Factory)
前言 本章我们将通过 LLaMA-Factory 具体实践大模型训练的三个阶段,包括:预训练、监督微调和偏好纠正。 大模型训练回顾 训练目标 训练一个医疗大模型 训练过程实施 准备训练框架 LLaMA Factory是一款开源低...
-
WhisperS2T:加速语音转文本的高效解决方案
WhisperS2T:加速语音转文本的高效解决方案 WhisperS2TAn Optimized Speech-to-Text Pipeline for the Whisper Model Supporting Multiple Inference E...
-
程序员掌握Stable Diffusion,下班后打造月入3000+的AI绘画副业
一、引言 在技术日新月异的今天,程序员这个职业不仅要求我们不断学习新技术,还需要我们具备一定的创新思维。作为一名程序员,我在接触到Stable Diffusion(以下简称SD)后,发现了新的副业机会。以下是我如何利用SD在下班后赚取额外收入,最终实...
-
弹幕背后:B站UP主创作服务解析
引言 在B站,每一条飘过的弹幕都是一个故事的碎片,它们汇聚成一幅幅生动的社交画卷。这里,不仅仅是一个视频分享平台,弹幕背后更是一个充满活力的创作者生态系统。B站以其独特的弹幕文化,为创作者和观众之间搭建起了一座互动的桥梁,让创意与情感在虚拟空间中自由...
-
ControlNetPlusProMax来袭:SDXL可控性灵魂CN组件再升级,多合一组件再添新功能
大家好我是安琪!!! 在数字图像生成领域,ControlNetPlusProMax的推出无疑是一次重大突破。作为SDXL的可控性灵魂CN组件的升级版,ControlNetPlusProMax在多合一组件的基础上,增添了更多实用新功能,为你的创意绘画之旅带...
-
全球首个语音指挥FPS AI ,腾讯魔方携最新AI成果亮相科隆展
AI究竟会如何改变游戏?这应该是全球游戏行业近年最为关注的问题之一。在最近正在德国举办的全球最大游戏展—科隆游戏展上,腾讯游戏魔方工作室群技术中心联合《暗区突围:无限》项目组,首次对外公布其全球首个语音指挥FPSAIF.A.C.U.L.的技术Demo。这是...
-
AI二创「黑神话」点燃全网!爆改二郎神,送自家狗子一键「成精」
【新智元导读】国产3A顶流《黑神话·悟空》,与AI联动起来了!网友纷纷开启二创,有人用AI续写神话,有人把自家二哈变成了精怪,甚至还有人自制了桌面壁纸! 全球玩家鏖战《黑神话·悟空》! 已经有打通关的玩家了,我不羡慕,因为通关后的空虚寂寞马上就会找上你们。...
-
AI智能体,年轻人的情感搭子
「AI智能体太好了,现实生活当中,我永远没办法得到永远不变的爱。」这是一位网友使用AI情感陪伴类App后的真实感受。 现在每月都有成百上千万的年轻人,近乎沉醉地与各种AI智能体对话。 他们每月花费在这些软件上的时间,甚至超过一周。他们把智能体当做恋人、朋友...
-
法律 | 法律人AI使用指南
原文:法律 | 法律人AI使用指南|法官|法院|文书|公司法_网易订阅 01 引言 过去半年多,我一直在尝试着用AI来辅助自己的各项法律工作,将AI融入自己的日常工作之中,并试图形成自身稳定的“法律+AI”工作流。在此过程中,我时常惊讶于AI高效的工...
-
有大佬曾吐槽搜索全广告!百度已有18%搜索结果由AI生成:称更准确了
快科技8月23日消息,李彦宏近日在第二季度财报电话会上表示,已有18%的搜索结果由AI生成,为用户提供更准确和直接的答案。 据悉,智能体在百度生态的分发量大幅增加,7月日均分发次数超800万次,为5月的两倍。 本季度,百度智能云营收达51亿元,同比增长14...
-
Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析
Llama 3.1 发布了!Llama 3.1 有三种规格: 8B 适合在消费者级 GPU 上进行高效部署和开发,70B 适合大规模 AI 原生应用,而 405B 则适用于合成数据、大语言模型 (LLM 作为评判者或蒸馏。这三个规格都提供基础版和指令调优...
-
comfyUI-MuseTalk用户交互体验的参数设计和设置
comfyUI-MuseTalk用户交互体验的参数设计和设置 目录 comfyUI-MuseTalk的参数设置 一、ComfyUI-VideoHelperSuite 二、comfyUI-MuseV合成的参考视频 2.1、什么时候会用到MuseV?...
-
Datawhale X 魔搭 AI夏令营-第四期 AIGC-Task 2
目录 认识AI助手——通义千问 操作指南 主要功能模块 精读baseline代码 分析代码的主体架构 逐行解释代码 其他疑问-向AI追问 进行实战——基于话剧的连环画制作 提示词准备 执行Task1的30分钟速通Baseline 修改...
-
GOLLIE : ANNOTATION GUIDELINES IMPROVE ZERO-SHOT INFORMATION-EXTRACTION
文章目录 题目 摘要 引言 方法 实验 消融研究 题目 Techgpt-2.0:解决知识图谱构建任务的大型语言模型项目 论文地址:https://arxiv.org/abs/2310.03668 摘要 大...
-
用Ollama 和 Open WebUI本地部署Llama 3.1 8B
说明: 本人运行环境windows11 N卡6G显存。部署Llama3.1 8B 简介 Ollama是一个开源的大型语言模型服务工具,它允许用户在自己的硬件环境中轻松部署和使用大规模预训练模型。Ollama 的主要功能是在Docker容器内部署和...
-
16 使用Llama Index提取术语和定义的指南
使用Llama Index提取术语和定义的指南 Llama Index有许多用例(如语义搜索、总结等),这些用例都有很好的文档记录。然而,这并不意味着我们不能将Llama Index应用于非常特定的用例! 在本教程中,我们将介绍使用Llama Ind...
-
非Transformer时代到来!全新无注意力模式超越Llama传奇
来源 | 机器之心 ID | almosthuman2014 Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。 此后,采用 Mamba 架构的模型...
-
v0 AI生成网页使用地址 Vercel可视化前端AI对话编程使用入口
v0 是什么? v0 是由Vercel推出的基于AI的生成式用户界面系统,它可以根据简单的文本提示生成适用于项目的React代码。v0 使用AI模型生成代码,基于shadcn/ui和Tailwind CSS,提供了易于复制和粘贴的代码。v0 不使用任何V...
-
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南 stable-diffusion.cppStable Diffusion in pure C/C++项目地址:https://gitcode.com/gh_mirrors/st/...
-
掌握 Llama 3.1:轻松本地部署与远程使用的全攻略
前言: Llama 3.1 是 Meta(Facebook 的母公司)发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B(80 亿参数)、70B(700 亿参数)和 405B(4050 亿参数)模型。其中,405B 是 Meta 迄...
-
AI绘画Stable Diffusion基础教程!
Ai绘图真的太火了,挡都挡不住。本着“不断好奇,不停学习”的理念,我打算介绍下Stable Diffusion,有兴趣的小伙伴可以一起学习。 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一...
-
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元 MU-LLaMAMU-LLaMA: Music Understanding Large Language Model项目地址:https://gitcode.com/gh_mirrors/...
-
Flux.1 版本又更新,更快更省显存,画质依旧美丽!
小伙伴们都知道 Flux.1 的出图效果很棒,但是对电脑的配置要求也同样很高,随便就要十几 G 显存才能体验,光这配置就劝退了很多小伙伴。 硬件要求真的是硬伤,不过地球是圆的,技术也总是在发展的,就在这几天,ControlNet 的作者张吕敏大大带着他的...