当前位置:AIGC资讯 > AIGC > 正文

ShowMeAI | 字节AIGC模型&工具大清单;AI解梦靠谱吗?AI MV制作手册;一文看懂MoE混合专家大模型;DeepSeek发布全球最强开源MoE模型

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!



1. 字节跳动生成式AI布局:卷到飞起的「App 工厂」这局也有点稳了?

字节最近有点猛啊!出圈的AI产品越来越多,迭代速度肉眼可见的快,「App 工厂」名不虚传 👍 根据能查到的信息,整理了一份「字节AI模型&产品清单」,遇到时可以确认 Made in ByteDance。> ⋙ 各产品详细信息可以看这里

🎨 模型层

Skylark (云雀):大语言模型,基于 Transformer 架构的自然语言处理模型,用于内容生成和理解 → https://www.volcengine.com/product/yunque

BuboGPT:多模态模型,结合文本、图像和音频输入的大型语言模型,具备视觉定位能力 → https://bubo-gpt.github.io

Boximator:视频编辑模型,根据文本提示,生成视频中的动作

PixelDance:结合图像和文本指令,生成复杂场景视频的模型 → https://makepixelsdance.github.io

MagicVideo:集成多个模块的 AI 视频生成框架,生成高审美价值视频 → https://magicvideov2.github.io

AnimateDiff-Lightning:文本到视频快速生成模型,提升视频生成速度 → https://huggingface.co/ByteDance/AnimateDiff-Lightning

ResAdapter:图形生成模型,生成任意分辨率和宽高比的图像 → https://github.com/bytedance/res-adapter/?ref=aihub.cn

SDXL-Lightning:文本到图像快速生成模型,生成高质量和高分辨率图像 → https://huggingface.co/ByteDance/SDXL-Lightning

扣子 / Coze:AI聊天机器人开发平台,支持快速创建、调试和优化AI聊天机器人 → 国内版 https://www.coze.cn;海外版 https://www.coze.com

🎨 应用层

豆包 / Cici:[AI对话平台] 基于云雀和GPT大模型的AI工具平台,提供聊天机器人、写作助手等功能 → https://www.doubao.com

小悟空 / ChitChop:[AI工具助手] 提供智能对话和辅助推荐功能 → 小悟空 https://wukong.com;ChitChop https://www.chitchop.com

猫箱 / AnyDoor:[AI角色互动] 用户可以创建AI角色并进行深度互动 → 猫箱 https://apps.apple.com/cn/app/%E7%8C%AB%E7%AE%B1-%E5%BC%80%E5%90%AF%E4%BD%A0%E7%9A%84-ai-%E5%A5%87%E9%81%87/id6475000292;AnyDoor https://www.anybagel.com

Dreamina:[AI图片视频应用] 辅助图片和视频创作 → 剪映 Dreamina https://dreamina.jianying.com;CapCut Dreamina https://www.capcut.com/ai-tool

星绘 / PicPic:[AI图片应用] 创建AI世界的分身并定制效果 → 星绘 https://apps.apple.com/cn/app/%E6%98%9F%E7%BB%98/id6475072892;PicPic https://apps.apple.com/ph/app/id6475074973

即创:[AI创意生产] 智能创意生产与管理平台,满足创作需求 → https://aic.oceanengine.com

海绵乐队:[AI音乐创作] 音乐创作工具,引入AI能力协助创作 → https://apps.apple.com/cn/app/id1620738933

河马爱学:[AI教育平台] 专为中小学生设计的AI教育平台 → https://www.hippolearning.cn

Gauth:[AI学习助手] 海外AI学习助手,提供拍照搜题服务 → https://www.gauthmath.com

识典古籍:[AI文化公益] 古籍数字化阅读平台 → https://www.shidianguji.com

MarsCode:[AI编程助手] 对标Replite做AI代码生成 → https://www.marscode.com



2. 采访了100多名创始人,我们发现 AI 对企业的影响,已经无处不在

Hampton 是美国一个会员社区,有大量的企业家、创始人和 CEO。最近,Hampton 邀请了 100 多位企业创始人,调研他们个人和企业是如何使用AI的,以及对业务发展带来了哪些影响。


以下是调研问卷的核心数据洞察:

35% 的企业为AI设立了专门的研发预算,其中 65% 的预算超过了10万美元,尤其以金融、生物技术和 SaaS 行业的研发预算最高。 37% 的创始人表示,AI影响了自己公司的员工数量。 创始人们有意识地避免在以下场景中使用AI:客户和个人数据、人力资源、创意工作。 89.6% 的创始人正在使用AI,或致力于在其业务中实施AI。

报告探讨的话题以及呈现都非常有意思!以下是报告详细讨论的话题,如果有感兴趣的 part,可以前往星球获取完整版报告 (资源编码【R257】)

各行业使用AI的情况分析 AI在企业中的普及度 不同收入规模企业的AI采纳现状 AI对企业员工规模和招聘策略的影响 AI影响最显著和最小的企业角色 创始人有意识避免使用AI的业务领域 AI研发预算 定制工具与第三方工具的对比 企业正在使用的AI工具清单 创始人及其团队正在使用AI工具清单 AI在营销和内容创作中的应用 AI带来的可量化的业务影响

3. AI 解梦靠谱吗?学界目前进展如何?未来有哪些靠谱的产品方向?

这是一篇「学术气质」超级浓郁的分析文章,围绕「AI + 梦」讨论了很多话题,比如解梦的科学研究方式和结论、梦境可视化、梦境&深度学习&对大脑的解析、商业化方向和比较知名的产品等。⋙ 阅读原文

咱们重点关注最后一个部分,一起探索下「如何用AI更好地理解做梦」这件事。

梦境的内容归因于大脑对白天收集信息的处理和整合。或者说,梦境提供了对我们潜意识深处的一瞥,揭示了隐藏的欲望、恐惧和情绪。

方向1:基于梦境进行对话。随着大模型等技术的兴起,出现了很多声称能够通过对话解析梦境的AI助手,还有一些宣称结合了中医典籍。对于可能存在「伪科学」嫌疑的研究,应该持有批判的审视态度。

方向2:梦境记录,比如苹果平台的 PlotPilot。我们对梦境的记录往往出现在刚睡醒或半睡半醒间,并且很大比例的梦境会在我们醒来后消失,一个好的记录工具就显得尤为重要。

方向3:帮助用户进入且稳定在清醒梦中,比如美国初创公司 Prophetic 开发的一款名为 Morpheus-1 的新型AI模型,以脑电活动为提示词,基于多模态大模型生成与该大脑状态相互作用的形状声波。



4. 6000字超详细复盘!南京 AIGC 城市宣传 MV 全流程制作解析

最近 AI 社区最火爆的创作复盘,应该就是 白马少年 这份南京城市宣传 MV 的详细流程解析了。从最终成片来看,创作者在工作流中融合了很多 AIGC 工具和技术。⋙ 阅读原文

根据创作者的分享,以下复原了整个创作流程,并整理了作者用到的 AIGC 工具,以及想实现的操作效果。

文案创作 工具:360浏览器的字幕提取功能、Kimi、GPT 效果:提取和分析参考文案,创作符合特定风格的文案 歌词创作 工具:GPT 效果:根据提供的文案改写为歌词,并为歌曲取名 歌曲创作 工具:suno (音乐创作平台) 效果:通过提示词创建纯音乐和带歌词的歌曲 分镜创作 工具:midjourney (画面生成)、Stable Diffusion (字体设计)、deforum (转场效果) 效果:生成有歌词部分的画面,进行无歌词部分的字体设计,以及制作转场效果 字体设计 工具:Stable Diffusion、controlnet (图像控制工具) 效果:结合南京各区特色,进行字体的创意设计 工具:DALL·E3 (构图绘制)、midjourney (画面美感生成)、sref和cref (风格统一命令) 效果:绘制构图,生成美感画面,统一风格 视频制作 工具:runway (视频编辑工具) 效果:对图生视频进行详细控制,制作动态视频 转场制作 工具:deforum (转场效果制作) 效果:制作瞬息全宇宙效果的转场,实现图像之间的过渡 高分放大 工具:Topaz Video AI 效果:提高视频分辨率和帧数,使视频更流畅 剪辑合成 工具:剪映 (视频编辑软件) 效果:进行视频合成,按照音乐节奏摆放片段,添加转场特效和字幕

5. 天工优质科普文:一文看懂 MoE 混合专家大模型

最近半年,各种 MoE 大模型层出不穷,比较有名的既有 OpenAI GPT-4、谷歌 Gemini、Mistral、马斯克xAI Grok,还有国内 天工、Minimax、DeepSeek 等。

天工官方公众号这篇文章,就非常清晰地了 MoE 技术原理 & 优缺点,并解释了它能成为「当红炸子鸡」的深刻原因。


文章写得非!常!好!没有那些云山雾罩的术语和公式,用环环相扣的逻辑、平实朴素的问答,就把 MoE 解释得非常清晰。不愧是官方出品吼 👍 ⋙ 阅读原文



6. DeepSeek 发布全球最强开源 MoE 模型,官方大佬在知乎说了 5 点

4月17日,DeepSeek 发布了新版大模型 DeepSeek-V2,并大声喊出了「全球最强开源MoE模型」,引发了AI社区一波大震荡。👆 上图可以看到,DeppSeek-V2 的价格,便宜到全球独一档,让人看得惊讶又高兴 😱😁

今天 DeepSeek 官方大佬 @罗福莉 现身知乎,给出了 5 点非常重要的信息。⋙ 知乎问答

单论 DeepSeek-V2 模型的中文水平,是真实处在国内外闭源模型的第一梯队 (GPT4、文心4.0等) 。因为没做 RAG 等功能,所以实际在官网的体感没那么惊艳,但这不妨碍API效果!外加1元/百万输入Tokens的价格,只有 GPT-4 价格的1/100,性价比之王!

怎么兼顾模型效果和成本?基本纯靠:模型结构创新 (MLA + DeepSeekMoE) + 超强Infra。MLA 妙就妙在,它既是 training efficient MQA,也是 inference efficient MHA。从今天起,放弃 MHA/GQA,全面拥抱 MLA 吧。同时,不严谨来说,DeepSeekMoE 也算是开启了「共享expert+细粒度expert分割」的 sparse 框架风 – 完全不同于 Mixtral MoE 的做法。简而言之:创新力就是第一生产力!

我们坚持了一贯朴实无华、真诚直接的开源风格,技术报告、模型权重、vllm推理代码都开源了。希望聚集开源社区智力,加速AGI时代到来。

未来还会持续给大家带来更惊艳的开源模型 (希望有机会可以“明目张胆”的说超过了GPT4-Turbo),所以大家不用担心模型断更,也不用担心API涨价 (目前就是大规模服务的价格,不亏本,利润率超50%)。

DeepSeek 团队的每一个人都非常优秀,DeepSeek-V2是群体智慧的结晶,创始人也是我坚信的国内最适合技术驱动型创业的!以及,最重要的,非常期待同样对AGI充满好奇心和创新力的各类人加入 (技术&非技术都需要)。



7. 2024 年巴菲特股东大会:AI影响力堪比原子弹,但人类对 AI 的未来知之甚少 (全文5万字)

5月4日,一年一度的伯克希尔股东大会在美国小镇奥马哈重磅开幕。在股东大会上,巴菲特先后谈到了已故老搭档芒格、减持苹果、AI影响、现金储备、接班人、投资比亚迪等热点问题。

在长达 5 个小时的会议中,有 2 处提到了人工智能和生成式AI。日报将巴菲特的核心观点总结如下。感兴趣可以根据关键词,检索并 阅读原文。


① 巴菲特:我对人工智能一无所知,但人工智能对世界的影响力堪比原子弹

AI的诞生很像当前的「核技术」。短期内加速了历史进程,但长期看却有很多负面和风险因素。我们不可能让「已经从瓶子里跳出来的精灵」再回到瓶子里了,只能在当下慎重决策。 AI对未来的影响,毫无疑问是巨大的。但是这个影响很难被具体评估,只能让它自然而然地发生。我对此一无所知。

② 伯克希尔哪项业务在AI面前风险最大

任何一个劳动密集行业都会受到AI威胁。 AI带来的一大好处,就是能释放部分劳动时间,帮助提升工作效率、拿到更多结果、减少流程损耗。有了更多时间的人类,可以参与更多的娱乐活动。 但是,匆忙实施AI,可能会带来不可控的社会影响。例如社会的劳动力分配是一个复杂的机制,并不是效率越高越好。可能我们还需要仔细分辨,哪些任务交给AI是合适的。 现在预言这些为时尚早。我也不认为当下的各种预测是正确的。

8. 苹果财报电话会议,库克看好苹果的AI前景,但是具体信息啥也没说 (全文1万字)

5月3日,苹果今日发布了 2024 财年第二财季业 。财报发布之后,苹果首席执行官 Tim Cook 、首席财务官 Luca Maestri 出席了财报电话会议,在解读第二财季财报的同时,回答了华尔街分析师的提问。 ⋙ 阅读原文

其中有2个问答与AI有关,但是有效信息不多。问答要点如下 (emmm 库克回答的艺术):


问:人工智能将如何带动苹果的营收增长?

库克:生成式AI和AI都将给我们的产品带来巨大的机遇。我认为苹果处于有利位置。我们将在接下来的几周内详细讨论。

问:苹果的人工智能战略,将同时面向消费者和企业,还是有先后顺序?

库克:苹果在第二财季以及之前的几个财季中,一直专注于向企业销售硬件设备。我认为苹果在企业市场,包括全球的企业市场,都拥有巨大的机会。

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ > 前往 🎡ShowMeAI,获取结构化成长路径和全套资料库,用知识加速每一次技术进步!

总结

**AI日报&周刊合集:探索生产力工具的前沿与行业动态**
---
**1. 字节跳动AI生态飞跃:“App工厂”实力显露**
- 字节跳动迅速推出AI产品及服务,展示了强大的“App工厂”实力。
- 推出多款AI模型与产品,包括Skylark、BuboGPT、Boximator等,横跨多个应用领域。
- 提供详细的“字节AI模型&产品清单”,引领行业发展趋势。
**2. AI企业应用普及化:100位创始人深度调研**
- 调研发现超过八成的企业正实施AI或考虑其应用,特别是在金融、生物技术与SaaS领域。
- AI影响企业招聘策略,但创始人避免在客户数据、人力资源和创意工作中使用AI。
**3. 探索梦境 AI 之流:“解读之梦”风险及趋向**
- AI解梦研究蓬勃发展,涵盖对话解析、梦境记录与清醒梦诱导等多个方向。
- 强调科学研究的严谨性,对伪科学保持批判态度。
**4. 南京AIGC城市宣传片流程揭晓:融合了高科技与专业团队的联手作业**
- 文章公布了使用多个AIGC技术工具创作南京城市宣传MV的详细流程。
- 涉及文案、歌词、歌曲、分镜、字体设计、视频制作等多个环节。
**5. MoE混合专家大模型解读:天工科普引领行业前沿**
- 文章详细介绍了MoE(混合专家)技术原理与应用场景。
- 以天工等大模型为例,探讨MoE的优缺点及其行业影响力。
**6. DeepSeek开源MoE创惊艳开场**
-发布了所谓的"全球最开源 MoE" 新品深范减税,震惊 AI 社区。
-详细讲解了其在创新模型结构与低成本维护上的五大特色与愿景。
**7. 巴菲特股东大会:AI影响力堪比原子弹**
- 巴菲特在股东大会上对AI的影响发表了深刻的看法,指出其对未来可能产生的深远影响。
- 对伯克希尔公司未来的AI战略表示担忧,强调谨慎对待AI的发展。
**8. 苹果财报电话会议:AI前景看好但细节未明**
- 苹果CEO Tim Cook在财报电话会议上对AI的未来持乐观态度,但具体战略细节未透露。
- 强调苹果在AI领域的优势,并计划在未来几周内详细讨论AI相关的增长机遇。
---
通过本次合集,我们得以一窥AI领域的最新动态,从字节跳动的AI布局到苹果对AI前景的展望,再到AI在各行各业的具体应用与影响,为我们展示了AI技术蓬勃发展的壮丽图景。同时,我们也应该认识到,虽然AI为我们带来了巨大的便利与可能,但也面临着挑战与不确定性。在未来,我们期待更多AI技术的创新与突破,同时也需要保持谨慎与理性的态度,共同探索AI的无限可能。

更新时间 2024-07-15