github 第19页 - AIGC资讯

250行代码从头搭建Llama 3，GitHub一天4.6k星！Karpathy大赞

Llama系列作为为数不多的优质开源LLM，一直受到开发者们的追捧。在Hugging Face社区的文本生成模型中，几乎是「霸榜」的存在。就在520这天，一位名叫Nishant Aklecha的开发者在推特上宣布了自己的一个开源项目，名为「从头开始实...

人工智能 2024-05-21 人工智能

980阅读

AI 框架Ambient Diffusion：从图像中获取灵感，而非复制

强大的人工智能模型有时会出现错误，包括虚构错误信息或将他人作品作为自己的。为了解决后者的问题，德克萨斯大学奥斯汀分校的研究团队开发了一种名为 "Ambient Diffusion" 的框架。该框架通过对无法辨认的图像数据进行训练，绕过了 AI 模型复制他人...

AIGC 2024-05-21 人工智能

923阅读

自动驾驶第一性之纯视觉静态重建

本文经自动驾驶之心公众号授权转载，转载请联系出处。纯视觉的标注方案，主要是利用视觉加上一些GPS、IMU和轮速计传感器的数据进行动静态标注。当然面向量产场景的话，不一定非要是纯视觉，有一些量产的车辆里面，会有像固态雷达（AT128）这样的传感器。如...

AIGC 2024-05-21 人工智能

927阅读

替代MLP的KAN，被开源项目扩展到卷积了

本月初，来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。 KAN 在准确性和可解释性方面表现优于 MLP，而且它能以非常少的参数量胜过以更大参数量运行的 MLP。比如，作者表示，他们用 KAN 以更小的网络和更高的自动化...

大数据 2024-05-20 人工智能

825阅读

Karpathy称赞，从零实现LLaMa3项目爆火，半天1.5k star

一个月前，Meta 发布了开源大模型 llama3 系列，在多个关键基准测试中优于业界 SOTA 模型，并在代码生成任务上全面领先。此后，开发者们便开始了本地部署和实现，比如 llama3 的中文实现、llama3 的纯 NumPy 实现等。十几个小...

生成式AI 2024-05-20 人工智能

948阅读

首个GPU高级语言，大规模并行就像写Python，已获8500 Star

经过近 10 年的不懈努力，对计算机科学核心的深入研究，人们终于实现了一个梦想：在 GPU 上运行高级语言。上周末，一种名为 Bend 的编程语言在开源社区引发了热烈的讨论，GitHub 的 Star 量已经超过了 8500。 GitHub：http...

AIGC 2024-05-20 人工智能

893阅读

云开发工具初创公司Replit在推动生成式AI的同时裁员20%

云开发工具初创公司 Replit Inc.，作为推动生成式人工能编码的先锋，宣布裁减30名员工，约占其总员工数的20%。 Replit 首席执行 Amjad Masad 在公司员工间发送的一封电子邮件中宣布了这一消息，该邮件今日发布在 X（原 Twitte...

大数据 2024-05-17 人工智能

849阅读

通义千问 2.5 “客串” ChatGPT4，你分的清吗？

作者：张添翼、董艺荃引子 OpenAI 发布了最新的 GPT-4o 模型，通义千问也在前不久刚发布通义千问 2.5，已经和 GPT-4-Turbo 不分伯仲：既然目前还没有和 GPT-4o 文本生成能力的对比数据，就让我们来和大模型一起做个游...

人工智能 2024-05-16 人工智能

972阅读

数字化转型公司UST培训超过 80% 的员工提升生成式AI技能

全球数字化转型解决方案公司 UST 推出了一个培训计划，旨在培训超过2.5万名员工，提升他们在生成 AI（GenAI）领域的技能，并为他们提供职业发展机会。该公司的发言人表示，这一计划将建立在公司 “加强人工智能能力的悠久历史” 基础之上。为了让员工保持...

人工智能 2024-05-16 人工智能

844阅读

AI失业潮已来，程序员职业是否真的会消失？

近日，随着OpenAI发布突破性的多模态机器学习模型GPT-4o，关于人工智能引发全球性失业潮的报道再次占据各大媒体头条。国际货币基金组织董事总经理克里斯塔利娜·格奥尔基耶娃博士警告称，随着企业大量采用人工智能技术，全球劳动力市场将遭遇“海啸”，人工...

大数据 2024-05-16 人工智能

818阅读

识别细胞也能用大模型了！清华系团队出品，已入选ICML 2024 | 开源

大模型带来的生命科学领域突破，刚刚再传新进展。来自清华系，使用大模型实现了单细胞身份识别，同时模型LangCell也正式对外开源。它不仅可以准确识别细胞身份，还具有很强的零样本分析能力，论文已被ICML 2024录⽤。 LangCell的数据集中包...

生成式AI 2024-05-16 人工智能

944阅读

一些 Llama3 微调工具以及如何在 Ollama 中运行

Llama3是Meta提供的一个开源大模型，包含8B和 70B两种参数规模，涵盖预训练和指令调优的变体。这个开源模型推出已经有一段时间，并且在许多标准测试中展示了其卓越的性能。特别是Llama3 8B，其具备小尺寸和高质量的输出使其成为边缘设备或者移动设...

人工智能 2024-05-16 人工智能

6660阅读

Ollama如何构建自己的Llama3中文模型

Ollama Ollama 是一个开源的大型语言模型（LLM）服务工具，它允许用户在本地机器上运行和部署大型语言模型。Ollama 设计为一个框架，旨在简化在 Docker 容器中部署和管理大型语言模型的过程，使得这一过程变得简单快捷。用户可以通过简单的...

大数据 2024-05-16 人工智能

1291阅读

首个中文原生DiT架构！腾讯混元文生图大模型全面开源，免费商用

中文 AI 社区迎来了一个好消息：与 Sora 同架构的开源文生图大模型来了！ 5 月 14 日，腾讯宣布旗下混元文生图大模型全面升级并全面开源，目前已在 Hugging Face 平台及 GitHub 上发布，包含模型权重、推理代码、模型算法等完整模型...

生成式AI 2024-05-15 人工智能

1136阅读

GPT-4o干掉初创全网实测，马斯克Karpathy等大佬纷表不服：OpenAI不过如此

OpenAI一夜之间，又干掉了一大批初创公司。官方公布的全能模型GPT-4o的炸裂演示，即便过去了一天，依旧让全网深陷其中，无法自拔。凭借实时语音视频对话，GPT-4o已经深入教育、翻译、视频会议等领域的变革。 OpenAI科学家Lilian W...

生成式AI 2024-05-15 人工智能

875阅读

腾讯宣布混元文生图大模型开源： Sora 同架构，可免费商用

5月14日，腾讯宣布旗下的混元文生图大模型全面升级并对外开源，目前已在 Hugging Face 平台及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。这是业内首个中文原生的 DiT 架构文生图开源模型...

AIGC 2024-05-14 人工智能

933阅读

重磅！腾讯宣布混元文生图大模型开源： Sora 同架构，中英文原生DiT，可免费商用

5月14日，腾讯宣布旗下的混元文生图大模型全面升级并对外开源，目前已在 Hugging Face 平台及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。这是业内首个中文原生的DiT架构文生图开源模型，支...

人工智能 2024-05-14 人工智能

860阅读

腾讯混元文生图大模型宣布开源：首个中文原生DiT架构

今日，腾讯旗下引人注目的混元文生图大模型（混元DiT）宣布全面开源，这一重要举措标志着人工智能领域的又一里程碑。该模型已在Hugging Face和Github平台上发布，包含完整的模型权重、推理代码和算法，面向全球的企业与个人开发者免费开放商用。腾讯混...

生成式AI 2024-05-14 人工智能

875阅读

IBM向开源社区发布Granite AI模型

IBM研究院最近宣布对其Granite编码基础模型开源，目标是实现高级AI工具大众化，进而推动跨行业间代码编写、维护与开发方式的全面变革。 IBM的Granite编码模型是什么水平? Granite源自IBM简化编码流程的勃勃雄心。在意识到软件开发中所...

生成式AI 2024-05-14 人工智能

852阅读

微调工程师岗位可能并不存在，但使用 AI 编码工具已经成为刚需

智能编码工具的快速普及是否会带来全新的编程模式?“大力出奇迹”的规律还将继续适用吗?本文节选自 QCon 北京特别策划圆桌节目，内容摘自阿里云通义灵码产品技术负责人陈鑫在圆桌对话里的精彩回答。全文见:Sora很难跟进?微调就不是一个岗位?大力出奇迹将继续适...

生成式AI 2024-05-13 人工智能

884阅读

网友缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

Llama 3首发阵容里没有的120B型号竟意外“曝光”，而且十分能打？！最近这样一个号称是「Llama3-120b」的神秘大模型火了起来，原因在于它表现太出色了—— 轻松击败GPT-4、gpt2-chatbot那种。比如，面对像「观察希格斯场是否会...

大数据 2024-05-13 人工智能

848阅读

DLRover 如何拯救算力浪费？10 分钟自动定位故障机，1 秒内保存 Checkpoint！

欢迎大家在 GitHub 上 Star 我们：分布式全链路因果学习系统 OpenASCE:https://github.com/Open-All-Scale-Causal-Engine/OpenASCE 大模型驱动的知识图谱 OpenSPG:http...

人工智能 2024-05-13 人工智能

1035阅读

只需百行代码，让H100提速30%，斯坦福开源全新AI加速框架

AI 的快速发展，伴随而来的是大计算量。这就自然而然的引出了一个问题：如何减少 AI 对计算的需求，并提高现有 AI 计算效率。为了回答这一问题，来自斯坦福的研究者在博客《GPUs Go Brrr》中给出了答案。图片博客地址：https://haz...

大数据 2024-05-13 人工智能

810阅读

从零开始手搓GPU，照着英伟达CUDA来，只用两个星期

「我花两周时间零经验从头开始构建 GPU，这可比想象的要难多了。」总有人说老黄的芯片供不应求，大家恨不得去手搓 GPU，现在真的有人试了。近日，美国一家 web3 开发公司的创始工程师之一 Adam Majmudar 分享了他「手搓 GPU」成功...

AIGC 2024-05-13 人工智能

848阅读

生成式AI模型大PK——GPT-4、Claude 2.1和Claude 3.0 Opus

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介当前，RAG(检索增强生成系统的新评估似乎每天都在发布，其中许多都集中在有关框架的检索阶段。然而，生成方面——模型如何合成和表...

生成式AI 2024-05-13 人工智能

799阅读

Paper Digest | 基于原型学习的实体图谱预训练跨域推荐框架

可以看到，通过映射得到对应item相关的entity后，基于图谱推理流程，我们可以得到许多和映射得到的entity相关的高阶信息，如苹果这个公司有手机产品，而手机这类产品相关的公司有三星等，从而可以潜在的拉近和其他相关实体（如三星生产的手机等）间的关系。...

生成式AI 2024-05-11 人工智能

1015阅读

ControlNet作者新作爆火：P照片换背景不求人，AI打光完美融入

ControlNet作者新作，玩儿得人直呼过瘾，刚开源就揽星1.2k。用于操纵图像照明效果的IC-Light，全称lmposing Consistent Light。玩法很简单: 上传任意一张图，系统会自动分离人物等主体，选择光源位置，填上提示词，就能...

生成式AI 2024-05-11 人工智能

828阅读

四款值得推荐的AI辅助编程工具（支持C#语言）

前言在这个AI迅速发展的阶段，涌现出了一大批好用的AI辅助编程工具。AI辅助编程工具能够提高开发效率、改善代码质量、降低bug率，是现代软件开发过程中的重要助手。今天大姚给大家分享4款AI辅助编程工具（并且都支持C#语言），希望对大家有所帮助。 AI辅...

大数据 2024-05-11 人工智能

1225阅读

太酷了！手机上部署最新AI大模型！只需两步！

在当前的AI革命中，大模型扮演着至关重要的角色，而这背后的基础便是Scaling Law。简而言之，随着数据、参数和计算能力的不断提升，大模型的能力也随之增强，展现出小规模模型所无法比拟的“涌现能力”。越来越多的AI企业纷纷推出开源大模型，按照扩展定律实...

AIGC 2024-05-10 人工智能

1042阅读

所有生命分子一夜皆可AI预测！AlphaFold 3改变人类对生命的理解，全球科学家都能免费使用

AlphaFold 3再登Nature！这次重磅升级，不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。只有了解它们如何在数百万种组合中相互作用，我们才能开始真正理解生命的过程。这次的最大创新之一，是用上了AI绘画...

AIGC 2024-05-09 人工智能

967阅读

任天堂闪击GitHub，一夜删光8000多个模拟器代码仓库

任天堂闪击GitHub！一夜之间删除了8535个代码库。只要包含Yuzu Switch模拟器代码都不放过，称其非法绕过了任天堂的技术保护措施，并运行了非法盗版Switch游戏。 GitHub这边也作出了回应。开发者有时间可对侵权内容进行删除或更改。...

AIGC 2024-05-09 人工智能

799阅读

AI编程创业公司为何接连获得大额融资？

AI编程是生成式AI崛起以来最热门的赛道之一，不仅海内外大厂均有布局，而且已经诞生了数家融资额过亿，估值过10亿美元的头部创业公司。无论对于程序员还是企业客户，AI编程的本质价值是降本增效，而且它带来的效果是直接的，目前已有44%的程序员使用过AI编程软...

生成式AI 2024-05-09 人工智能

829阅读

Stack Overflow 大规模封禁账号：只因大量用户反对与 OpenAI 的合作

编译丨诺亚出品 | 51CTO技术栈（微信号：blog51cto）久负盛名的开发者论坛Stack Overflow最近宣布其与OpenAI达成合作，ChatGPT 将使用 Stack Overflow 的数据，而 OpenAI...

生成式AI 2024-05-09 人工智能

858阅读

综述170篇「自监督学习」推荐算法，港大发布SSL4Rec：代码、资料库全面开源！

推荐系统对于应对信息过载挑战至关重要，它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展，提升了对用户行为和偏好的洞察力。然而，由于数据稀疏性的问题，传统的监督学习方法在实际应用中面临挑战，这限制了它们有效学习用户表示的...

大数据 2024-05-09 人工智能

806阅读

港大开源图基础大模型OpenGraph 增强图学习泛化能力

香港大学数据智能实验室主任黄超团队开发了一款名为 OpenGraph 的图基础大模型，专注于在多种图数据集上进行零样本预测。该模型通过学习通用的图结构模式，仅通过前向传播即可对全新数据进行预测，有效缓解了图学习领域的数据饥荒问题。关键特点: 强泛化能...

大数据 2024-05-09 人工智能

854阅读

港大开源图基础大模型OpenGraph: 强泛化能力，前向传播预测全新数据

图学习领域的数据饥荒问题，又有能缓解的新花活了！ OpenGraph，一个基于图的基础模型，专门用于在多种图数据集上进行零样本预测。背后是港大数据智能实验室的主任Chao Huang团队，他们还针对图模型提出了提示调整技术，以提高模型对新任务的适应性。...

生成式AI 2024-05-09 人工智能

842阅读

前特斯拉Optimus科学家跳槽HF，直接开源了一个机器人代码库

今年 3 月，以构建大型开源社区而闻名的 AI 初创公司 Hugging Face，挖角前特斯拉科学家 Remi Cadene 来领导一个新的开源机器人项目 ——LeRobot，引起了轰动。 Remi Cadene 在今年三月宣布结束其三年的 Tesl...

AIGC 2024-05-08 人工智能

968阅读

DeepSeek发布V2模型 GPT-4的性能白菜的价格

DeepSeek在开源MoE（Mixture of Experts）模型领域取得了重要进展，继今年1月份开源国内首个MoE模型后，现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现，与GPT-4等闭源模型竞争，同...

人工智能 2024-05-07 人工智能

1031阅读

LeCun转发，AI让失语者重新说话！纽约大学发布全新「神经-语音」解码器

脑机接口（BCI）在科研和应用领域的进展在近期屡屡获得广泛的关注，大家通常都对脑机接口的应用前景有着广泛的畅享。比如，由于神经系统的缺陷造成的失语症不仅严重阻碍患者的日常生活，还可能限制他们的职业发展和社交活动。随着深度学习和脑机接口技术的迅猛发展，...

人工智能 2024-05-07 人工智能

873阅读

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一

最新国产开源MoE大模型，刚刚亮相就火了。 DeepSeek-V2性能达GPT-4级别，但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。因此一经发布，立马引发不小讨论。从公布的性能指标来看，DeepSeek-V2的中文综合能力超越...

人工智能 2024-05-07 人工智能

1039阅读

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，DeepSeek-V2[1]，全球最强开源 MoE 模型来了。 DeepSeek-V2 是一个强大的专家混合（MoE）语言模型，具有训练经济、推理高效...

大数据 2024-05-07 人工智能

989阅读

用于时间序列概率预测的分位数回归

分位数回归满足这一需求，提供具有量化机会的预测区间。它是一种统计技术，用于模拟预测变量与响应变量之间的关系，特别是当响应变量的条件分布令人感兴趣时。与传统的回归方法不同，分位数回归侧重于估计响应变量的条件量值，而不是条件均值。图(A : 分位数回归分...

大数据 2024-05-07 人工智能

881阅读

微调大语言模型的七个步骤

译者 | 布加迪审校 | 重楼在最近一年半的时间里，自然语言处理（NLP）领域发生了显著的变化，这主要得益于OpenAI的GPT系列等大语言模型（LLM）的兴起。这些功能强大的模型已彻底改变了我们处理自然语言任务的方法，在翻译、情绪分析和文本自动...

人工智能 2024-05-07 人工智能

1353阅读

瑜伽球上遛「狗」！入选英伟达十大项目之一的Eureka有了新突破

机器狗在瑜伽球上稳稳当当的行走，平衡力那是相当的好：各种场景都能拿捏，不管是平坦的人行道、还是充满挑战的草坪都能 hold 住：甚至是研究人员踢了一脚瑜伽球，机器狗也不会歪倒：给气球放气机器狗也能保持平衡：上述展示都是 1 倍速，没有经过...

生成式AI 2024-05-06 人工智能

832阅读

12年前上手深度学习，Karpathy掀起一波AlexNet时代回忆杀，LeCun、Goodfellow等都下场

没想到，自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。而如今，我们也进入了大模型的时代。近日，知名 AI 研究科学家 Andrej Karpathy 的一条帖子，让参与这波深度学习变革的许多大佬们陷入了回忆杀。从图灵奖得主...

大数据 2024-05-06 人工智能

857阅读

「代理人战争」！微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱

【新智元导读】为了搞钱，微软、OpenAI 、谷歌和Meta纷纷瞄准Agent这片蓝海，各顶尖高校也紧随其后。Agent才是商业学术两开花的未来! 大模型发展至今早已火成了一个「概念」。不管是学术界还是工业界，都要套上一层LLM的皮，方可彰显自己位于浪潮...

大数据 2024-05-06 人工智能

835阅读

OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架

本文经自动驾驶之心公众号授权转载，转载请联系出处。从一个新颖的3D MLLM架构开始，该架构使用稀疏查询将视觉表示提升和压缩到3D，然后将其输入LLM。题目：OmniDrive: A Holistic LLM-Agent Framework for...

人工智能 2024-05-06 人工智能

929阅读

58行代码把Llama 3扩展到100万上下文，任何微调版都适用

堂堂开源之王Llama 3，原版上下文窗口居然只有……8k，让到嘴边的一句“真香”又咽回去了。在32k起步，100k寻常的今天，这是故意要给开源社区留做贡献的空间吗？开源社区当然不会放过这个机会：现在只需58行代码，任何Llama 3 70b的微调...

大数据 2024-05-06 人工智能

849阅读

开发者福音！GitHub 推出AI原生开发环境Copilot Workspace，4大核心功能，预览版已发布！

编译 | 伊风出品 | 51CTO技术栈（微信号：blog51cto） AI编程界又有新神器了？GitHub 推出了人工智能原生开发环境 Copilot Workspace。旨在让“任何开发者都可以用自然语言从想法开始，创建代码，再...

大数据 2024-05-06 人工智能

877阅读

分享几个.NET开源的AI和LLM相关项目框架

现如今人工智能（AI）技术的发展可谓是如火如荼，它们在各个领域都展现出了巨大的潜力和影响力。今天大姚给大家分享4个.NET开源的AI和LLM相关的项目框架，希望能为大家提供一些参考。 https://github.com/YSGStudyHards/D...

大数据 2024-05-06 人工智能

820阅读