当前位置:AIGC资讯 > AIGC > 正文

国内大厂这么玩AI就对了!AI绘画版权攻防「黑魔法」;用AI赚到钱的人做对了什么;Agent机遇全解析;2024生成式AI学习路线图 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦!

? 小红书「AI涂鸦」,抖音「AI扩图」,国内大厂找到了AI正确打开方式

配图说明:小红书AI创作工具「此刻」

使用方式:点击首页底部「+」进入,点击「此刻」,输入文字后AI会根据内容自动生成图片,并且有「记事本」「聊感悟」「想吐槽」三种风格可供选择;点击图片右下角还可以刷新更换。

在这轮突然到来的 AIGC 浪潮里,很多大厂表现得「手足无措」,表现之一就是 App 跟风上线聊天机器人、绘图、总结等AI功能,而不考虑这些功能对业务场景是否有帮助 (最起码别帮倒忙)。

不得不说,小红书最近一年的表现真的非常「聪明」,出手精准,没有废招。

从开始的AI创作功能「此刻」,到群聊中添加AI角色 (好像没看到最新进展),从定位中国风的图片生成平台 TrikAI (训练数据集有争议,目前改名奇域),再到最近风靡的AI创作话题 #设计服装,小红书所有动作都统一指向了「降低创作门槛」。而且,小红书这几款产品的使用体验都不错,成为了可以信赖的创作工具,而不是让人兴致缺缺的AI玩具。

左侧配图:小红书AI创作工具「此刻-涂鸦」

使用方式:进入「此刻」界面后点击「涂鸦」,可以手绘涂鸦并选择生成图像的风格;也可以从下方系统预制的模式中选择更多玩法

右侧配图:小红书AI创作话题「#设计服装」

使用方式:进入主题笔记后,点击图片下方话题栏进入创作页面,AI可以根据简单的涂鸦创作出精美的图像

大家可以搜索「小红书涂鸦」,看看AI帮助人类「梦想成真」的那种美妙感~ 也可以自己玩起来!不过注意每日的生成次数限制~

配图说明:抖音中的AI相关话题和作品

另一个把AI玩出花的应用是抖音,实际上抖音已经被AI「包围」了!平台上AI创作话题已经非常多,爆款话题的播放量直接冲破十亿。

比如前几天很热门的「AI」扩图,使用AI应用将图片进行扩展补充,美轮美奂夹杂着稀奇古怪,在平台内掀起了新一轮的AI创作热潮。

左侧1:剪映,提供了非常多AI创作板块和模板

左侧2:抖音主页底部「+」进入创作界面,左滑至最左侧选择「AI创作」,上传或拍摄照片即可创作同款AI特效

右侧:抖音小程序 (不过一版需要看广告或者付费,使用需要排队,而且可能效果一般)

而且平台提供了超多AI入口,整体的创作和分享氛围特别棒!我把入口归为以下三类,感兴趣可以去试试啦!字节在大模型领域虽然起步稍晚,但是人才和资金积累雄厚,还有落地场景,真的不容小觑!


? 一边投毒一边发解药,AI绘画圈的版权攻防「黑魔法」

https://www.bilibili.com/opus/877081348899078212

补充一份背景:AI绘画模型在训练阶段需要大量语料 (图片),其中有一些图片没有经过艺术家或网站的授权,所以目前有版权争议。

@秋葉aaaki 是AI绘画领域的活跃创作者,在B站的粉丝量已经超过一百万。秋葉aaaki 分享了很多优质教程,并在持续制作更新 Stable Diffusion 模型一键启动包,为AI绘画新手提供了很大帮助。

12月20日,秋葉aaaki 在B站发布动态 (?链接如上),预告最新版的一键包。值得注意的是,这版把「毒丸」和「洁厕灵」一起放了进来:一边保护图像免受 AI 训练,一边破解这层防护 ?

评论区大家的回复很精准和搞笑:「卖坚不可摧的盾与无坚不摧的矛」「赛博军火商,一边给飞机,一边给防空导弹」…… 技术对抗进入到白热化阶段。

https://mist-project.github.io/

上面提到的 Mist 是一项图像预处理工具。如上图所示,在图像上添加水印后,人眼看不出差别,但用这种图片训练出的模型在生成图片时,会出现异常或者生成与tag不相关的图片。

Mist V2 上周刚刚发布,作者 @Psyker_ 发微博表示:希望通过 Mist 及相关技术实践引发人们关注 AI-for-Art 应用程序对既有版权制度带来的挑战,对艺术家群体在商业和美学层面的价值影响,以及本质上,我们如何看待和激励人类的创造力等问题。

实际上,随着AI技术越来越成熟,绘画行业在2023年受到了全面的影响和冲击。AI带来的效果提升,也使得很多从业者和潜在从业者,感受到了巨大的生存压力。

这些压力的出口之一,就是对 @秋葉aaaki 的攻击,认为ta的分享是「助纣为虐」。秋葉aaaki 也做出回应表示,大家要认清主要矛盾,攻击个人并不能阻止AI的发展。

一些极端攻击言论已经出超出了讨论范畴,就不截图了,指路微博 @赛博法医检验鉴定中心 了解更多细节。

AI图像生成领域的技术成熟更早,因此技术对抗和舆论对抗也来得更早。可以预见,随着文本生成、代码生成、视频生成等技术逐渐成熟,这些领域也将引爆就业危机和从业者的反叛。

? 半天时间,用 GPTs 把应用商店 TOP10 教育 App 重做一遍

GPTs 的发布似乎为产品经理再次创造了一个「黄金年代」:只要是有想法、有创意,都可以在 GPTs Store 中分享自己创造的应用,还有获得收益的机会。

作者用了半天时间,使用 GPTs 快速创作了 App Store 教育榜的****前十个 App,体验AI技术和教育场景的结合方式,以及我们可以用 GPTs 做些什么。

拍照搜题类

Question.AI https://chat.openai.com/g/g-8faMf1Vt7-question-ai

Nerd AI https://chat.openai.com/g/g-0DWGiIZBg-nerd-ai

Photomath https://chat.openai.com/g/g-vADIF4xYp-photomath

垂直场景类

Headway | 每天推荐一本书的摘要和精华片段选读 https://chat.openai.com/g/g-1D02jSDY5-headway-daily-book-summaries

Quizlet | 知识点记忆闪卡工具 https://chat.openai.com/g/g-0GF3gyKLN-quizlet

语言学习类

多邻国 | 用户以游戏化方式由浅入深学习语言 https://chat.openai.com/g/g-eFXc7iQad-duolingo-franch-learner

游戏化学习类

Clever | 玩一些趣味小游戏 https://chat.openai.com/g/g-fj2OlfNoM-clever-brain-logic-training

Toca World | 卡通少儿版的模拟人生 https://chat.openai.com/g/g-iMFYN80iB-toca-life-world

Aha World | 卡通少儿版的模拟人生 https://chat.openai.com/g/g-ENrzWXA32-aha-world

特殊学习类

Lingvano | 手语学习App https://chat.openai.com/g/g-ZvyclRl80-lingvano-sign-language-asl

PictureThis | 植物花朵拍照识别 https://chat.openai.com/g/g-3VWTGthHW-picturethis

业内普遍预测,教育将是被AI最深刻影响和颠覆的行业之一。虽然不知道「AI+教育」的未来是什么样的,但当下积极的探索也很有价值!作者在这些探索里有几条很棒的洞察:

GPTs 在处理单一任务方面表现出色,如拍照搜题

GPTs 当下起到的核心作用,是为厂商和开发者提供了一个小工具,能够快速验证原生AI功能效果

GPTs 挑战了厂商的数字资产和知识库运用能力

GPTs 的UI设计能力不足,用户体验和审美体验在应用中仍具有重要意义 ⋙ 阅读原文


? 用AI做副业的赚钱门道,以及赚到钱的人做对了什么

https://github.com/bleedline/aimoneyhunter

这是一个很特别的 GitHub 项目,把市面上有关「AI副业」的灵感和经验分享,进行了分类整理:

AI脚本视频赚钱:图片绘本故事、虚拟人口播、小说漫画推文、电影剧情解说、热点选题技巧

视频变幻赚钱:瞬息全宇宙、热舞小姐姐、无限穿越放大&缩小景别

视频翻译&视频搬运

AI图片赚钱副业:个人头像、桌面壁纸、模特换装、商品广告、儿童绘本、表情包、家具&装修、LOGO制作、照片修复

AI文案赚钱副业:新媒体推文、AI论文代写、AI小说编剧、AI简历改写

AI音频赚钱副业:AI声音克隆、AI音乐

AI直播:无人货架直播、虚拟人直播

而且!作者为每个细分领域,都收集了4-5篇经验分享帖,来展示详细的操作步骤和注意事项,比如「AI简历改写」这部分:

无需GPT的AI简历生成器!助你求职之路更有竞争力!

应届生的从0到offer:手把手教你用AI打造出面试率99%的简历

求职神器ChatGPT帮你三分钟搞定从0到满分简历

ChatGPT+简历修改服务,月盈利过万 | 保姆级教程公开,人人可做!

如何开始副业最稳妥呢?作者给了几个建议:

做内容搞流量,而不是做一个产品去卖

做铲子,而不是挖金子

不想花钱,就要花时间

做资产,而不是卖时间

做自媒体流量,抱着平台吃饭,是当下用AI做副业最亲民的路径

如果你想依靠技术赚钱,那么以下几条一定要认真领悟,避免走弯路:

做垂类,而不是做平台

做顺人性的,而不是逆人性的

从小切入,别一上来想搞太大

开源赚流量,比闭源挖金子强

Build in Public ,获取公共认同

Copycat,有信息茧房就有钱赚

做国外而非国内

赚有钱人的钱,赚想赚钱人的钱

搞明白目标用户、核心功能、产品核心卖点和目标用户聚集地

目前有一些已经验证可行的技术赚钱方案,商业模式比较清晰,但也各有挑战需要克服:

套壳站:创建站点,支持私有化部署或贴牌,通过分销系统出售给小老板

API聚合:封装AI能力为API,赚取差价

发卡站:利用开源站自动出售GPT账号,为号贩子提供便利

聚焦AI工具:找到刚需市场,用AI满足特定领域或需求

模型训练:为甲方提供模型训练服务

? AI领域最火热&最大的赛道:Agent 机遇全解析

补充一份背景:3月 AutoGPT 爆火出圈后 Agent 开始进入开发者和投资人视野,11月 OpenAI DevDay 推出官方 Agent 框架 Assistant API 更是给这个赛道「加了把火」。

Agent 无疑是近期AI创投领域最火热的赛道。Bill Gates 也发文表示,Agent 不仅会改变每个人与电脑互动的方式,还将颠覆软件行业,引领自输入命令到点击图标以来最大的计算机革命。

Atom Capital (新锐风险投资基金) 近期组织了一次闭门沙龙,邀请一众领域专家和一线创业者,深入探讨Agent的落地、挑战及机遇。

沙龙观点整理成的这篇文章非常专业且高屋建瓴,可以说一篇带你走到学术研究和行业发展最前沿。日报整理了文章核心观点,⋙ 非常推荐阅读原文

从创投行业角度,当下 LLM based Agent 领域初创公司可大致分为两类:

中间层 infra:提供实用可复用的 Agent 框架,为 Agent 合作提供机制设计

Vertical Agent:深入某个垂直领域,理解该领域专家的工作流,运用 Agent 思路设计 Copilot 产品

经过广泛的创业测试,以下场景更契合 Agent 落地:

做到比普通员工好,帮助团队从琐碎中解脱出来,做更重要的事

企业落地的很多场景,本质是 Text to SQL

写代码,实际上人类不擅长但AI很擅长的细分领域,最适合Agent去落地探索 (比如正则表达式)

为什么 Agent 落地这么难?

从实践层面,影响目前 Agent 落地的原因有两个:① API质量差且没有形成生态,② 与场景的封闭程度相关;最理想的落地情况,是有大量垂直领域数据 (给到大模型做预训练)、场景封闭、问题基本可穷举

核心原因是目前大模型缺乏应用领域「世界模型」,因为世界模型的建立非常困难;现阶段「世界模型」的缺乏,是大模型的「缺陷」,但也给做 Vertical Agent 的公司带来了机遇

最近半年 Multi-Agent 框架更为流行:事先给 Agent 设定不同的角色 (如产品经理、程序员、UI/UE等等),再让这些 Agents 一起协作完成一个任务,效果比使用单一 Agent 框架 (如 AutoGPT) 好很多

多模态大模型相较于大语言模型的提升和变化

目前的多模态模型主要是通过连接视觉和文字两个模态的数据进行对齐,没有从预训练环节做多模态的训练

多模态包含更多信息,极大增强了交互的输入输出带宽,在自动驾驶、机器人等领域具有更广泛的应用前景

对 Agent 未来的几个预判

AI Native 工作流:重新思考人机协同的工作模式,以实现最优的工作流程 → 可能重新定义下一代企业级软件

真正的多模态:将多种模态的语料一起训练,或实现视觉模态 encoder 与大语言模型共同做决策 → 可能带来突破式发展

Agent 自我进化:实现 Agent 自我进化,如生产新 Agent 或设计协作组织结构 → 涉及通讯及协作模式的前沿探索


? 一种非常新颖的提示词 (Prompt) 结构:Format + Reference + Request + Framing

https://www.nngroup.com/articles/ai-prompt-structure/

这篇文章给出了一个非常新颖的提示词架构,包含四个关键组成部分:

请求 (Request):提示词的核心部分,表达了希望解决的问题或需求

提问:Should dogs eat kibble?

隐式请求:I need a dinner meal plan for 7 days on a budget

命令:Give me some ideas around real estate

一些不完整的句子:Tips for doing a successful surprise proposal

引用 (References):有助于消除歧义,确保AI理解用户的需求

内部引用,即引用AI之前的回答:

外部引用,如引用文档或第三方来源:Review job summary. Match in tone to this: [a previous section of her resume].

格式 (Format):描述了期望AI输出的具体属性

长度:Act as an Artificial Intelligence expert and tell me what is necessary to connect Bing to Bard to Anthropic to ChatGPT and give a response in one window.

语言:Translate the following informal note for my house cleaner. Use standard informal Spanish (Mexico).

呈现方式:can you give a visualization of the convolutional connections and recurrent connections

语调:Please write me an email thanking a group for attending a meeting including a question/answer section. This email should be professional and not too long.

框架 (Framing):提供了问题的背景信息或用户的需求场景,良好的框架可以减少查询的重复和模糊性

给出足够的背景信息:I trying to decide which car to purchase. My three choices are a 2023 Kia Telluride, a 2023 Kia Carnival, and a 2023 Jeep Grand Cherokee L. Please compare the 3 in the following categories; safety, cost, and online reviews.

要求扮演某种角色:Act as an Artificial Intelligence expert and tell me what is necessary to connect Bing to Bard ta Anthropic to ChatGPT and give a response in one window.

当然也有例外,作者给出了三种常见的其他类型提示词语句,并说明了适用场景。整篇文章中,作者总结了很多提示词使用的小技巧!! 感兴趣的话可以整理到自己的小本本上啦~

你能… (Can you) 提示词:这类提示词通常表示用户对AI能力的不确定性,他们通过询问AI是否能够完成特定任务来了解AI的功能

给我更多 (Give me more) 提示词:这类提示词表示用户对AI的当前回答不满意,希望获得更多选项或信息

填充词 (Filler prompts):这类提示词没有实际的信息需求,主要用于表达用户对AI的满意程度或在对话中保持礼貌

? 硅谷知名机构 a16z 最新报告:Big Ideas in Tech for 2024

https://a16z.com/big-ideas-in-tech-2024/

中文翻译版 https://gamma.app/public/Big-Ideas-in-tech-in-2024-by-A16Z-phquomraxnzc1fs

a16z 邀请了40多位投资人,来总结 2023 并展望 2024,看看各行业和细分领域的发展现状和未来方向。

原始报告包含美国活力、生物+健康、消费科技、加密、金融科技、游戏、成长阶段技术、基础设施+企业等多个方向。

?上方第二个链接是中文版本,且挑选了与AI关系最为紧密的几个领域。各方向的判断都有让人「眼前一亮」的感觉,非常不错!!

? 消费科技

语音优先交互的AI应用:智能语音助手将在未来成为我们生活中的重要部分,提供更加自然、便捷的交互方式

垂直定制、定向构建的AI:针对特定行业和场景的定制化AI解决方案将不断涌现,以满足不同领域的需求

无代码AI生成工具:无代码AI工具将降低创新门槛,让更多人能够利用AI技术进行创作和创新

创造力得到增强:AI技术将助力提升人类的创造力,使得创意产出更加丰富和多样

? 成长期科技

超越文本聊天的新型讲故事方式:AI将推动更多样化、沉浸式的叙事方式,不再局限于文本聊天

CRM 将由人工智能数据收集提供支持:AI技术将帮助改进客户关系管理 (CRM) 系统,通过智能数据收集提升企业与客户的互动

AI战场从模型转向用户体验:竞争重点将从AI模型的性能转向为用户提供更优质、易用的体验

? 基础设施和企业

人工智能的可解释性:提高AI模型的透明度和可解释性,以便更好地理解和控制其决策过程

重新构想创意:AI将改变创意产业,为设计师、艺术家等创意工作者提供新的创作方式和灵感

嵌入您工作流程中的B2B AI产品:AI将更加紧密地融入企业的日常工作流程,提高生产力和效率

新的「分工」:AI技术将改变劳动力市场的分工,人类和AI将共同完成更多任务

LLM 推进RPA的发展:大型语言模型 (LLM) 将推动机器人流程自动化 (RPA) 的发展,实现更智能、高效的业务流程

? 游戏

极客技术可以找到 PMF 的领域:游戏行业将继续探索新技术,以实现产品市场匹配 (PMF)

永无止境的AI优先 (AI-First) 游戏:AI将在未来游戏中发挥核心作用,创造全新的游戏体验

游戏成为「一切模拟器」:游戏将模拟现实世界的各个方面,为玩家提供沉浸式体验

从聊天机器人到拟人形象:AI陪伴3D化:AI角色将从简单的聊天机器人发展为更具人性化的三维形象,提供更丰富的互动体验

下一个迪士尼是一家游戏公司:游戏公司将越来越多地涉足影视娱乐领域,成为新一代的娱乐巨头

动漫游戏成为主流:动漫风格的游戏将继续受到欢迎,吸引更多玩家

新一代UGC游戏开发者涌现:用户生成内容 (UGC) 的游戏开发者将不断涌现,推动游戏行业的创新

《我的世界》带来生存类游戏的爆发:《我的世界》等游戏将推动生存类游戏的发展,创造更多类似体验

? 加密货币

人工智能+区块链的结合:AI和区块链技术将相互结合,共同推动去中心化、安全和透明的技术发展

当人工智能成为游戏制造者时,加密货币提供保证:在游戏制作过程中,AI将发挥更大作用,而加密货币将为其提供激励和保障机制,确保游戏的公平性和完整性

? 2024生成式AI学习路线图

https://github.com/krishnaik06/Roadmap-To-Learn-Generative-AI-In-2024

这份「Roadmap To Learn Generative AI In 2024」路线图把生成式AI切成几大知识板,并给出了具体知识点的学习链接 (主要是 YouTube 视频)。

整体看来不错!知识整理和资料挑选都挺用心,感兴趣可以 Follow 学习,或者参照框架规划自己的学习路径:

Python Programming Language

Complete Python Playlist In English

Complete Python Playlist In Hindi

Flask Playlist

Fast API Tutorials

Basic Machine Learning Natural Language Processing

Why NLP?

One hot Encoding, Bag Of Words,

TFIDF

Word2vec,AvgWord2vec

Basic Deep Learning Concepts

ANN - Working Of MultiLayered Neural Network

Forward Propogation, Backward Propogation

Activation Functions, Loss Functions

Optimizers

Advanced NLP Concepts (Day 6 - Last Video)

RNN, LSTM RNN

GRU RNN

Bidirection LSTM RNN

Encoder Decoder, Attention is all you need ,Seq to Seq

Transformers

Starting the Journey Towards Generative AI (GPT4,Mistral 7B, LLAMA, Hugging Face Open Source LLM Models,Google Palm Model)

OpenAI

Langchain Tutorials With Projects

Chainlit

Vector Databases And Vector Stores

ChromaDB

FAISS vector database, which makes use of the Facebook AI Similarity Search (FAISS) library

LanceDB vector database based on the Lance data format

Cassandra DB For storing Vectors

Deployment Of LLM Projects

AWS

Azure

LangSmith

LangServe

HuggingFace Spaces

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

? 订阅合集 #ShowMeAI日报 ,一览AI领域发展前沿,抓住最新发展机会!

点击 ?生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

◉ 点击 ?日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 ?生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

更新时间 2024-02-12