-
TrajectoryNAS:一种用于轨迹预测的神经结构搜索
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://arxiv.org/pdf/2403.11695.pdf 本文介绍了TrajectoryNAS:一种用于轨迹预测的神经结构搜索。自动驾驶系统是一项快速发展的技术,其可以实现...
-
等不及公开了!最新Sora模型细节揭秘:预计峰值需要72万块H100!每月至少4200块H100!缩放定律依旧有效!
作者 | Matthias·Plappert 翻译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI的Sora模型能够生成各种场景的极其逼真的视频,令世界惊叹不已。除了一篇公开的技术报告和TikTok上放出的酷炫视频,就...
-
清华和微软联合起来对提示词下手了!直接缩短80%,跟大模型对话的头疼系数直线下降!变相扩大了上下文窗口!
出品 | 51CTO技术栈(微信号:blog51cto) 想一下,现在普通人调用个大模型有多别扭,你得一个个上传文件,然后再告诉它自己想要什么样的输出,最好给它一套优秀的模版,它才能给出个像样的回答。 这就好比你自己的大脑都快想出答案来了,它只不过是帮...
-
苹果再发多模态论文!陪我们走过十年的“Hey Siri”会被更智能的交互方式取代吗?
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 全面发力AI的苹果,再出新研究! 随着人工智能技术的发展,我们熟悉的“Hey Siri”或将成为历史。 苹果团队最新出炉的论文《利用大型语言模型进行设备指向性语音检测的多模...
-
OpenAI的Sora在NVIDIA H100上生成1分钟视频约需12分钟
据Factorial基金估计,OpenAI的Sora每小时在NVIDIA H100上生成5分钟的视频,相当于每天能生成120分钟的视频。报告进一步指出,为支持TikTok和YouTube的创作者社区,大约需要89,000个NVIDIA H100GPU。合并...
-
OpenAI颠覆导演!首批7个Sora超现实大片震惊好莱坞
Sora给好莱坞的震撼,就在刚刚变成了现实! 几天前,「OpenAI正在向好莱坞推销Sora」的消息才刚刚传出。 而今天一早,首批拿到Sora授权的导演、艺术家们,就已经公开自己创作的最新短片了。堪称神速! OpenAI为之配文——Sora初印象。...
-
stable-diffusion-webui中stability的sdv1.5和sdxl模型结构config对比
sdv1.5 v1-inference.yaml model: base_learning_rate: 1.0e-04 target: ldm.models.diffusion.ddpm.LatentDiffusion params:...
-
【愚公系列】2024年03月 《AI智能化办公:ChatGPT使用方法与技巧从入门到精通》 013-用 ChatGPT 生成图片(AI绘画主流工具介绍)
🏆 作者简介,愚公搬代码 🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,51CTO博客专家等。 🏆《近期荣...
-
在Raspberry Pi上运行本地LLM和VLM
译者 | 朱先忠 审校 | 重楼 在树莓派上使用Ollama的本地LLM和VLM(作者本人提供照片) 前言 有没有想过在自己的设备上运行自己的大型语言模型(LLM)或视觉语言模型(VLM)?你可能想过,但一想到从头开始设置,必须管理有关环境,还要下载正...
-
保姆级教程!奶奶都能学会的Mac本地部署Stable Diffusion教程
一、为什么选择Stable-diffusion 举一个简单的例子,Midjourney和Stable diffusion在照片处理领域就好比是“美图秀秀”和“PS”;在短视频制作领域,就好比是“剪映”和“PR”。 这样说是不是更容易理解了,如果你是新...
-
预见AI的下一个十年!从Suleyman到LeCun,三位大佬坐而论道:颠覆医疗保健业、图灵测试升级、AI与物理世界交融
编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 近日,人工智能界三位大佬聚首了! 一位是最近“跳槽”微软的Inflection AI 联合创始人 Mustafa Suleyman、一位是Cohere的联合创始人兼首席执行官Aida...
-
良心!vivo离职员工意外收到年终奖;传苹果使用百度AI功能;阿里魔搭类Sora模型开源;Kimi带火,多家大厂开卷“长文本”
出品 | 51CTO技术栈(微信号:blog51cto)一、商业圈 1.vivo前员工离职大半年突然收到年终奖 日前,有vivo前员工在小红书平台发帖感谢vivo称,离职将近大半年,突然收到年终奖,还称相比去年有涨幅,此外,主动离职也给了N+1补偿。在...
-
能玩3D游戏的AI玩家!谷歌新智能体SIMA发布,但水平还在“新手村”
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 世界上第一位AI程序员Devin诞生,让大家纷纷转发感叹“饭碗保不住”。 一转眼,具有里程碑意义的AI玩家也来了!谷歌(Google)旗下DeepMind发布新智能体SIMA。 S...
-
微软围着Copilot 转!首款AI PC能算惊艳吗?网友:9分钟宣传片让人昏昏欲睡
出品 | 51CTO技术栈(微信号:blog51cto) 微软的首款AI PC来了! 面向商务人士的两款Surface 设备,旨在让AI帮白领们好好打工。 AI的确非常热。但是!如果你想看到具备颠覆性的AI产品的话,微软可能会让你失望了。TechCr...
-
【愚公系列】2024年03月 《AI智能化办公:ChatGPT使用方法与技巧从入门到精通》 015-用 ChatGPT 生成图片(Midjourney生图方法)
🏆 作者简介,愚公搬代码 🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,51CTO博客专家等。 🏆《近期荣...
-
Sora三巨头首次解密幕后信息,CTO:最快年内开放
“Sora最快今年内开放公测。” 在一场访谈中,OpenAI CTO Mira Murati亲自透露了这一消息。 短短10分钟里,Sora技术细节、进展、规划等当下最热议的问题,都有了更进一步解答: 生成20秒的720P视频只需几分钟 计算资源远超C...
-
Stable Diffusion老板也跑了!核心研发已集体辞职,“稳定AI”乱成一锅粥
好突然! 就在今天,Stability AI CEO宣布辞职了。 Emad Mostaque,既不再担任CEO,公司董事会也退出。 消息一出,大伙都无比震惊。 据悉,首席运营官Shan Shan Wong和首席技术官Christian Laforte...
-
LangChain+llama.cpp+llama-cpp-python工程学习笔记(一)
LangChain 是一个开发由语言模型驱动的应用程序的框架,有以下特性。 数据感知 : 将语言模型连接到其他数据源 具有代理性质 : 允许语言模型与其环境交互 pip install langchain 报错ERROR: Could not...
-
LLM、RAG虽好,但XGBoost更香!
编译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 数据&AI企业家、投资人Oliver Molander 近日在LinkedIn上的帖子中打趣道:“如果你在2022年[ChatGPT推出]之前问人工智能专家什么是LL...
-
【本地大模型部署与微调】ChatGLM3-6b、m3e、one-api、Fastgpt、LLaMA-Factory
本文档详细介绍了使用ChatGLM3-6b大模型、m3e向量模型、one-api接口管理以及Fastgpt的知识库,成功的在本地搭建了一个大模型。此外,还利用LLaMA-Factory进行了大模型的微调。 1.ChatGLM3-6b 2.m3e 3....
-
Hinton痛悔毕生工作,AGI十年内降临或导致「奥本海默」灾难!图灵巨头联手中国专家为AI划红线
「现在我变成了死亡,世界的毁灭者。」 这是奥本海默曾经引用印度教经文《薄伽梵歌》中的一句话。 上世纪40年代,奥本海默的发明,如同天地初开,彻底重塑了世界的面貌。原子弹的问世,带来了一场空前的毁灭危机,让人类面临前所未有的生存考验。 1945年8月,就在...
-
基于LLM的Unity游戏开发利器——LLMUnity
在本文中,我们将向您展示如何在Unity引擎中使用LLM(大型语言模型)。我们将使用LLMUnity包(https://github.com/undreamai/LLMUnity)展示如何仅用几行代码即可搭建一个交互对话的实例! 免责声明:我本人是LLM...
-
突发!Stability AI核心团队已分崩离析,抢功、侵权、撤资争议不断,AI界有自己的“春山学”
撰稿丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) AI绘画赛道素来拥挤,免费开源的文生图模型Stable Diffusion无疑是其中的佼佼者。这一明星项目的背后公司之一Stability AI的身价也一路水涨船高,很快以10亿美元估...
-
巨头争锋:AGI来到临界点?
作者丨Mohit Pandey 编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 曾经,通用人工智能似乎距离我们很远,但如今事情发生了变化。AGI很快就会到来吗? 有些人认为这一目标将在明年达成,有些人预测在2029年实现,还有些...
-
【UE5】离线AI聊天-接入LLAMA语言模型 教程
前言:LLAMA是一种神经网络模型,全称为Language Model with an Average Attention Mechanism(具有平均注意机制的语言模型)。它是一种用于自然语言处理任务的模型,特别适用于生成文本和回答问题。LLAMA模...
-
【本地化部署Stable Diffusion WebUI(MACOS安装)】
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、Stable Diffusion WebUI适配三类芯片 二、安装 1.安装git、conda等 2.选定目录及下载Github远程仓库文件 3....
-
官宣|Apache Flink 1.19 发布公告
Apache Flink PMC(项目管理委员)很高兴地宣布发布 Apache Flink 1.19.0。与往常一样,这是一个充实的版本,包含了广泛的改进和新功能。总共有 162 人为此版本做出了贡献,完成了 33 个 FLIPs、解决了 600 多个问题...
-
百万token上下文窗口也杀不死向量数据库?CPU笑了
“Claude 3、Gemini 1.5,是要把RAG(检索增强生成)给搞死了吗?” 随着新晋大语言模型们的上下文窗口(Context Window)变得越发得长,业界人士针对“RAG终将消亡”观点的讨论也是愈演愈烈。 之所以如此,是因为它们二者都是为...
-
优于所有方法!HIMap:端到端矢量化HD地图构建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 矢量化高清(HD)地图构建需要预测地图元素的类别和点坐标(例如道路边界、车道分隔带、人行横道等)。现有技术的方法主要基于点级表示学习,用于回归精确的点坐标。然而,这种pipeline在获得elemen...
-
OpenAI 首席技术官:不确定 Sora 的训练数据来自哪里
3 月 18 日消息,OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora,然而该公司首席技术官 (CTO Mira Murati 在接受华尔街日报采访时却语焉不详,无法明确说明 Sora 的训练数据来源。 在采访中,记者直接询问 Mura...
-
iniucloud采集插件的应用解析
在当前的数据驱动时代,企业和个人对信息的需求越发精细与个性化。“niocloud采集插件”便是在这种背景下诞生的、为用户提供全方位数据抓取服务的重要工具。它不只解放了大量重复劳作的劳动力,同时为用户解决了在众多散乱网页和程序中定位和抓取信息时所遇的问题,特...
-
huggingface的diffusers训练stable diffusion记录
代码:https://github.com/huggingface/diffusers/tree/main/examples/text_to_image 2006.11239.pdf (arxiv.org 论文 2006.11239.pdf (ar...
-
大模型增速远超摩尔定律!MIT最新研究:人类快要喂不饱AI了
我们人类可能要养不起AI了! 近日,来自MIT FutureTech的研究人员发表了一项关于大模型能力增长速度的研究, 结果表明:LLM的能力大约每8个月就会翻一倍,速度远超摩尔定律! 论文地址:https://arxiv.org/pdf/2403.0...
-
一键点、万物动! 腾讯混元联合清华、港科大推出图生视频大模型“Follow Your Click”
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 3月15日,腾讯混元和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click“,基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原...
-
硬刚“CloseAI”,马斯克如期开源Grok,最大开源大语言模型一夜易主!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 开源了! 3月11日,马斯克曾发表了一篇“字少事大”的推文,并且设为了置顶。就一句话:xAI要在本周开源自家聊天机器人 Grok了。 消息一出,关注着Musk VS. Ope...
-
"基于Discuous平台的多角度网站信息数据采集与价值深探
摘要:在现代网络安全与用户信息收集设计规范之中,"D ह्याASCII prefect XVIhesized Binder fro concurrently++ ;QUml -----χουν emulator节目 она BoltArtsDataRo...
-
马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星
说到做到,马斯克xAI的Grok,果然如期开源了! 就在刚刚,xAI正式发布3140亿参数混合专家模型Grok-1的权重和架构。 3140亿的参数,让Grok-1成为迄今参数量最大的开源LLM,是Llama 2的4倍。 目前,xAI关于Grok-1...
-
stable diffusion采样详解
采样:模型会在Latent Space中生成一个完全随机的图像,然后噪声预测器会从图像中减去预测的噪声。随着这个步骤的不断重复,最终得到一个清晰的图像。 Stable Diffusion在每个步骤中都会生成一张新的采样后的图像,整个去噪...
-
AI程序员Devin卧底工作群修bug!和CTO聊技术,网友:顶级码农水平
首个AI程序员Devin,现身明星创业公司内部群。 为解决一个技术问题,Devin借用了其创造者的账号,与客户公司的CTO交流,并根据回复调整了代码方案。 对话之专业,围观者看了直呼这个世界太疯狂。 事情发生在办公软件Slack,截图中的akshat是...
-
以Python实现网站爬虫的技术探究与应用
在当今互联网时代,信息爆炸式地增长,如何有效地从海量的网页数据中提取出所需的信息成为了一个重要的问题。网站爬虫(Web Crawler),也称网络爬虫或网页蜘蛛,是一种自动化程序,用于遍历互联网上的网页并抓取相关信息。Python作为一种简洁高效、易于上手...
-
基于Discuz!平台的采集器开发深度探究
Discuz!作为一款流行的社区论坛软件系统,为用户提供了一个方便、稳定的交流平台。在日益发展的信息时代,如何更有效地从互联网上获取信息成为了众多开发者关注的焦点。而“采集器”则在这样的背景下应运而生,它能够从不同的来源抓取数据并整合到统一的平台上。本文将...
-
Stable Diffusion 跑通总结
记录了自己跑通Stable Diffusion的过程和踩过的坑,目前只是初步跑了一下,没有很深入的使用代码,希望能有一些参考价值。 在Windows系统运行,需要提前装好Conda 一、下载代码和模型 1、下载代码: 代码下载:代码地址 或者...
-
通过Discuz实现微信采集的实践与方法
随着互联网技术的发展和信息交流的便捷性不断增加,如何将微信这样具有广大用户基础和海量内容的社交平台的数据信息集成到其他网络平台上,尤其是在建设和管理自身论坛的过程中充分发挥其效能,已经成为了很多论坛管理者面对的现实课题。在此环境下,微信采集成了一门热门的技...
-
2023年评选:探寻最佳Discuz论坛采集器,助力数据采集与整合
在互联网时代的浩瀚信息海洋中,论坛一直是知识分享、交流互动的重要平台。Discuz,作为一款在国内颇具影响力的论坛系统,其开放性和丰富的插件生态吸引了大量站长和用户的青睐。然而,随着大数据时代的来临,如何从Discuz论坛中高效、准确地采集信息,成为了不少...
-
OpenAI再陷巨大争议?Sora训练数据被质疑非法,CTO采访疯狂翻车
【新智元导读】最近,OpenAI CTO Murati接受采访时,对Sora训练数据语焉不详、支支吾吾的表现,已经成了全网热议的话题。毕竟,要是一个处理不好,OpenAI就又要陷入巨额赔偿金的诉讼之中了。 最近,OpenAI CTO在采访中大翻车的表现,已...
-
道听途说国产大模型文心一言代码能力很差?
场景: 针对个人的最近的一个日常使用场景的一个需求。启动特定的程序,需要输入ak_key,sk_key。每次启动都要输入,就很麻烦。我希望有一个简化调用这个程序的东西。自动帮我输ak_key,sk_key简化我的使用成本。 于是,我寄希望于通过文心一言...
-
Stable Diffusion WebUI安装报错解决
本人是一个AI新手,最近在研究文生图方面相关内容时看到Stable Diffusion WebUI这个项目,想在本地部署安装试用看下效果,安装过程中遇到了一些问题,此处记录一下 问题1:Python 3.12.1 (tags/v3.12.1:2305ca...
-
LLaMA-Factory 8卡4090 deepspeed zero3 微调Qwen14B-chat
环境安装 推荐使用docker,Ubuntu20.04https://www.modelscope.cn/docs/%E7%8E%AF%E5%A2%83%E5%AE%89%E8%A3%85 docker pull registry.cn-beijin...
-
Midjourney教学使用教程,AI绘图赏析prompt,手把手教你Midjoureny注册和使用
一、引言 话不多说请先赏图: 目前 Midjourney 暂不支持免费次数了,尽量付费吧。 如果不清楚如何付费请参考:【保姆级】国内如何购买midjourney?midjourney购买教程?midjourney注...
-
How does Stable Diffusion work?
Stable Diffusion is a latent diffusion model that generates AI images from text. Instead of operating in the high-dimensional im...