-
【AIGC调研系列】CogVLM2:第二代视觉大模型
CogVLM2是智谱AI推出的新一代多模态大模型,继承并优化了上一代模型的经典架构。CogVLM2采用了一个拥有50亿参数的强大视觉编码器,并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块[1]。这一设计使得CogVLM2在视觉和语言理解方面实现...
-
Llama 3 实践教程(InternStudio 版)
文章目录 Llama3本地 Web Demo部署 初始环境配置 下载模型 Web Demo 部署 XTuner 微调 Llama3 个人小助手 自我认知训练数据集准备 XTuner配置文件准备 训练模型 推理验证 XTuner微调Lla...
-
人工智能AI和数字化世界走向何方
2024 年 5 月 23 日,美国众议院外交事务委员会以压倒性多数投票提交了一项法案,该法案将使拜登政府更容易限制 AI 系统的出口。该法案还将赋予美国商务部明确的权力,禁止美国人与外国人合作开发对美国国家安全构成威胁的 AI 系统。 路透社本月报...
-
百度文心一言用户破 2 亿,李彦宏:文心大模型已成中国最领先的 AI 基础模型
过去,开发者用代码来改变世界,未来,自然语言将成为通用的编程语言。 用代码书写历史的程序员会被 AI 取代吗?一个全知全能的大模型能适配一切吗?大模型成本过高怎么办?在这个 AI 时代,什么样的工具才能被称为最好用的工具? 这些问题,并非空中楼阁,而是...
-
ai绘画生成软件有哪些?轻松实现从简单到复杂的图片创作需求
现如今,AI技术的融入为创作者提供了前所未有的便利和可能性。短短几年间,从简单的图案生成到复杂的场景构建,AI绘图工具已经能够协助艺术家们解决各种绘画难题。 但是,我们常常会遇到一些问题:如何在保持个人风格的同时,提高作品的专业度?如何在时间紧迫的情...
-
AI绘画Stable Diffusion 高清放大,多种方法详解,建议收藏!
? 本章概述 在Stable Diffusion我们想要得到一张高分辨率且具有细节特征的图片时,我们就需要使用一些图片放大算法来帮助我们实现。 本文主要概述在sd中常常使用的高清修复方法以及不同方法的区别和应用场景。同时也给出一些推荐的工作流,你可以根...
-
众神听令,王者归位!Meta最强开源大模型 Llama 3 重磅来袭
整理 | 王轶群 责编 | 唐小引 出品丨AI 科技大本营(ID:rgznai100) 4月19日凌晨,Meta重磅发布了全球最大开源大模型Llama 3,一夜间重新坐稳王者之位。 模型下载链接:https://llama.meta.com/lla...
-
AIGC系列之:DDPM原理解读(简单易懂版)
目录 DDPM基本原理 DDPM中的Unet模块 Unet模块介绍 Unet流程示意图 DownBlock和UpBlock MiddleBlock 文生图模型的一般公式 总结 本文部分内容参考文章:https://ju...
-
如何在本地搭建集成大语言模型Llama 2的聊天机器人并实现无公网IP远程访问
文章目录 1. 拉取相关的Docker镜像 2. 运行Ollama 镜像 3. 运行Chatbot Ollama镜像 4. 本地访问 5. 群晖安装Cpolar 6. 配置公网地址 7. 公网访问 8. 固定公网地址 随着ChatGPT...
-
AI写作助手Rytr,可以自动写博客
文章目录 Rytr简介 实际体验 Rytr简介 RYTR 是一个 AI 写作助手,可生成文章、博客帖子、产品描述、电子邮件等内容,甚至可以帮忙发朋友圈。目前,RYTR支持...
-
【实战】Stable Diffusion抠图插件爬坑经历,SD实操案例
今天给大家分享使用后期处理插件stable-diffusion-webui-rembg实现抠图功能。 一、安装步骤 1、主页面,依次点击 扩展 -> 可下载 -> 加载扩展列表 2、搜索rembg 3、点击安装并等待安装完成...
-
古诗文绘画配图,最新AI绘画提示词
如今AI 盛行的时代,会用AI 工具是多么简单快捷而且挣钱方便的打开方式,慢慢跟着时代的前沿技术和站在巨人的肩膀上你也可以站的高看得不一样的风景,行动起来,用你的智慧打动我们,做出一幅幅价格昂贵且别具风格的图片,让你发现自己的价值。 如何用AI工具制作古...
-
AIGC内容分享(三十一):作品集排版 | AI/AIGC设计案例分享
目录 前言 未来AI生活设计 AIGC设计探索 Alibaba.com IP形象AIGC探索 前言 " 在过去,无论是制作3D、2D还是手绘的品牌IP形象海报和设计物料,我们都需要投入大量的人力,并面临不同设计师技能水平的差异,很难实现...
-
从零开始学AI绘画,万字Stable Diffusion终极教程(三)
【第3期】Lora模型 欢迎来到SD的终极教程,这是我们的第三节课 这套课程分为六节课,会系统性的介绍sd的全部功能,让你打下坚实牢靠的基础 1.SD入门 2.关键词 3.Lora模型 4.图生图 5.controlnet 6.知识补充...
-
llama_factory微调踩坑(自用)
环境配置 torch>=1.13.0已经不在支持CUDA11.3以下的版本了,CUDA版本必须升级,可以查看 nvidia-smi 在conda虚拟环境中安装的cuda版本必须<=CUDA Version 多GPU跑 c...
-
AI绘画Midjourney最详细易懂的注册使用教程
前言 随着ChatGPT席卷全球,生成式AI越来越受关注,其中AI图像生成涌现很多工具。 Midjourney 是一款强大的 AI 图像生成工具,只需要简单的自然语言描述就能快速生成图像。 与其他AI图像生成相比,Midjourney学习成本更低,生...
-
ChatGPT如何「思考」?心理学和神经科学破解AI大模型,Nature发文
美国东北大学的计算机科学家 David Bau 非常熟悉这样一个想法:计算机系统变得如此复杂,以至于很难跟踪它们的运行方式。 「我做了 20 年的软件工程师,研究非常复杂的系统。这个问题总是存在的。」Bau 说。 但 Bau 说,使用传统软件,具有内部知...
-
LLaMA-Factory+qwen多轮对话微调测评
目录 训练的时间和效果 数据准备 数据样例 数据配置 环境搭建 模型微调训练 模型预测 运行成功的web UI LLaMA-Factory地址:https://github.com/hiyouga/LLaMA-Factory/blo...
-
GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示
AI发展到今天,其智能水平与人类相比已经不遑多让了,没有一个人可以像AGI一样「包罗万象、吐纳自如」。 这个时候,我们如何还能守住人之为人的尊严? 有的人说,至少人类是社会性的存在,我们可以听得懂同类的「弦外之音」,可以与他人产生共情,而机器是冰冷的。...
-
Stable Diffusion XL优化终极指南
如何在自己的显卡上获得SDXL的最佳质量和性能,以及如何选择适当的优化方法和工具,这一让GenAI用户倍感困惑的问题,业内一直没有一份清晰而详尽的评测报告可供参考。直到全栈开发者Félix San出手。 在本文中,Félix介绍了相关...
-
机器学习:K均值算法
一、基础理论 1. 欧氏距离 想象你在北京,想要知道离上海有多远,则可以直接计算这个城市(两点)间直线的距离,这就是欧氏距离。 在二维平面上,在二维平面上有两个点A(x1, y1 和B(x2, y2 ,欧氏距离为: 图片 欧氏距离衡量的是两点间的真实物理...
-
大学本科生论文需要查aigc吗?哪个平台AI率更高呢!
这是必须要查的, 无论你是否使用了ai辅写都需要做aigc检测。 原因很简单,aigc检测的是疑似率。就算是完完整整自己完成的也避免不了会出现aigc疑似语句,要是你的写作风格与众多ai的其中一个相似都会被判定为疑似aigc生成语句。 aigc疑似率的检测...
-
一文读懂 Arthur Bench LLM 评估框架
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估 。 众所周知,LLM 评估是人工智能领域的一个重要议题。随着 LLM 在各个场景中的广泛应用,评估它们的能力和局限性变得越来越重要。作为一款新兴...
-
一文搞懂Midjourney的所有指令
大家好 我是野生的树下老师,今天分享midjourney有哪些指令,都是怎么用的呢? 跟着我的脚步走起~ 指令 释义 /imagine 通过提示词生成图片 /settings 查看当前MJ机器人默认设置 /ask 获取问题答案 /r...
-
英伟达赢麻了!马斯克xAI超级算力工厂曝光,10万块H100、数十亿美元
最近几年,随着大语言模型的飞速发展与迭代,科技巨头们都竞相投入巨额财力打造超级计算机(或大规模 GPU 集群)。他们认为,更强大的计算能力是实现更强大 AI 的关键。 早在 2022 年,Meta 即宣布与英伟达共同打造大型 AI 研究超级计算机「AI...
-
iOS引入ChatGPT板上钉钉!曝苹果与OpenAI已达成正式协议
快科技5月27日消息,据媒体报道,马克古尔曼(Mark Gurman)爆料,苹果已经与OpenAI签署了协议,确认将在iOS 18操作系统中引入ChatGPT的聊天机器人功能。 这一消息预计将成为苹果6月份全球开发者大会(WWDC)的亮点之一。 古尔曼在其...
-
手把手教你如何开通GitHub Copilot并且在vscode中使用
很多小伙伴应该已经知道Copilot的鼎鼎大名了,也有一些白嫖怪白嫖了3个月免费试用期后找不到续费的渠道,今天就给大家献上一篇续费/开通Copilot的文章; 1.首先登录git: git; 以及fomepay 2.点击头像->Copil...
-
披萨上涂胶水、建议用户吃石头、毒蘑菇……谷歌又被大模型带沟里
继「把马斯克画成黑人」后,谷歌 AI 再度闯祸。 近日,有网友使用谷歌的 AI Overview 功能进行搜索,却得到了一堆离谱的回答。例如,告诉用户在披萨上涂胶水,或者建议他们吃石头等。谷歌 AI「满嘴跑火车」的回答迅速在社交媒体上发酵,甚至有网友发...
-
马斯克xAI完成60亿美元B轮融资 将发布多个技术更新和产品
马斯克人工智能初创企业xAI宣布完成60亿美元B轮融资,该轮融资得到了包括 Valor Equity Partners、Vy Capital、Andreessen Horowitz、Sequoia Capital、Fidelity Management &...
-
【含win+Mac整合包】本地部署Stable Diffusion,超详细(AI 绘画保姆级教程,100%成功部署)
什么是stable diffusion? stable diffusion是在2022年发布的基于扩散模型的文本到图像生成模型,起初它只有一堆api供开发者使用,可以说非常难上手,随着2023年5月由AUTOMATIC1111大佬基于SD API开发的...
-
Hinton揭秘Ilya成长历程:Scaling Law是他学生时代就有的直觉
2003年夏天的一个周日,AI教父Hinton在多伦多大学的办公室里敲代码,突然响起略显莽撞的敲门声。 门外站着一位年轻的学生,说自己整个夏天都在打工炸薯条,但更希望能加入Hinton的实验室工作。 Hinton问,你咋不预约呢?预约了我们才能好好谈谈。...
-
昆仑万维:天工AI每日活跃用户DAU超过100万
昆仑万维宣布,其天工AI的每日活跃用户(DAU)已突破百万大关,这一成就不仅体现了广大用户对天工AI的热情追捧,也标志着昆仑万维在AI领域的技术和产品能力得到了市场的广泛认可。 自天工AI大模型推出以来,昆仑万维始终坚持以用户体验为中心,不断优化产品体验,...
-
midjourney-proxy-plus搭建教程
目录 0.演示环境 1.创建Midjourney网页 2.搭建mj代理地址 3.创建目录文件 4.同步和开放数据库端口 5.拉取镜像 6.创建容器 0.演示环境 CentOS 8 宝塔8.0 Nginx >= 1.19....
-
多模态预训练模型在 OPPO 端云场景的落地实践
一、端侧图文检索技术研究 1. 解决了什么问题? 首先来介绍图文检索技术。以前在手机端相册搜索照片,都是基于标签来搜索。从 CLIP 模型出现后开始做自然语言搜索。目前正在解决端侧性能、搜索效果、安全等问题。技术难度并不大,重点在于提高搜索速度。并...
-
马斯克xAI官宣435亿元B轮融资:估值已突破1300亿!
快科技5月27日消息,埃隆马斯克旗下的人工智能初创企业xAI近日宣布,已经成功完成60亿美元(约合435亿元人民币)的B轮融资,公司估值达到180亿美元(约合1304亿元人民币)。 本轮融资的主要投资者包括Valor Equity Partners、Vy...
-
关于AIGC发展历程的研究报告(原创文章)
摘要: 2022年,Chat GPT和Stable Diffusion展现了AIGC强大的技术实力,拉开了AIGC时代的帷幕。2023年,GPT-4、Midjourney V5等又掀起了人工智能的热潮,2024年2月15日(美国当地时间)正...
-
OpenAI又一吹哨人离职!拉响安全警报,风险隐患实在太大
OpenAI离职潮中,又一研究员官宣离职,并且还发出了“警告”信息: Ilya和Jan Leike的担忧正是我的担忧,还有一些额外的问题。 我们需要做更多事来改进决策流程等基础性的事务,包括问责制、透明度、文档、策略执行、如何谨慎使用技术,以及减轻不平...
-
AI小说推文一键生成:未来写作的新潮流
Hey,各位朋友们,今天我要跟大家分享一个超级酷炫的话题——AI小说推文一键生成!是的,你没听错,就是那种动动手指,就能让AI帮你写小说的神奇技术。这不仅仅是科技的飞跃,更是我们这些创作者的一大福音啊! 一、AI小说推文,到底是个啥? 首先,让我们来聊聊...
-
10分钟Window本地部署stable diffusion AI绘图【入门教程(1)
2、下载模型 下载AI模型,用于生成图片的模型,该官网需要注册才能下载,大家自行注册下载就行,我这边下载的1.4版本的。此模型有4G,下载比较慢。 下载后把名字改为:model.ckpt,并放入文件夹stable-diffusion-main/mode...
-
鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好
鹅厂搞了个150多人的“翻译公司”,从老板到员工都是AI智能体! 主营业务是翻译网络小说,质量极高,参与评价的读者认为比真人翻译得还要好。 而且相比于雇佣真人,用它来翻译文学作品,成本降低了近80倍。 公司名为TransAgents,每个岗位都配备了3...
-
AI PPT一键生成:让演示更简单,更智能
大家好,我是头条号的作者,今天给大家带来一个超级实用的分享——AI PPT一键生成工具。在这个快节奏的时代,我们每个人都可能需要快速制作演示文稿,无论是为了工作汇报,还是学术演讲。但传统PPT制作既耗时又需要一定的设计技巧,这对于很多人来说是一个不小的挑战...
-
免费AI出图神器:StableStudio——定义AI作画新前景
StableStudio:探索艺术与科技的无限交界,StableStudio引领AI智能创作新浪潮! - 精选真开源,释放新价值。 概览 ChatGPT大语言模型AI的诞生引爆了对AIGC的讨论。AIGC 又称生成式 AI (Generat...
-
可控核聚变新里程碑,AI首次实现双托卡马克3D场全自动优化,登Nature子刊
几十年来,核聚变释放能量的「精妙」过程一直吸引着科学家们的研究兴趣。 现在,在普林斯顿等离子体物理实验室(PPPL)中 ,科学家正借助人工智能,来解决人类面临的紧迫挑战:通过聚变等离子体产生清洁、可靠的能源。 与传统的计算机代码不同,机器学习不仅仅是指令...
-
🤖📚 强烈推荐的AI小说推文神器
随着人工智能的发展,AI写作工具逐渐普及,它们能够帮助我们生成文章、故事、对话等内容。今天就来给大家安利一些最佳AI小说推文网站和工具,让你的创作灵感源源不断!? 1. SalieriAI AIStoryBuilders ? SalieriAI AISto...
-
普通人如何通过AIGC逆风翻盘?
终身学习: 利用AI辅助的在线教育平台,如Coursera、edX、Khan Academy等,学习新技能或提升现有技能。 尝试使用AI驱动的语言学习应用,如Duolingo、Rosetta Stone等,提高语言能力。 探索AI辅助的编程学习平台...
-
全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型
为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面,一种有效的方法是根据人类反馈的强化学习(RLHF)。尽管经典 RLHF 方法的结果很出色,但其多阶段的过程依然带来了一些...
-
字节AI出海,再造AI时代的TikTok?
探索大模型应用的字节,已经在海外尝到了甜头。 最近,“字节Gauth碾压作业帮”、“Gauth下载量暴涨,仅次多邻国”等消息备受瞩目。据第三方数据统计,4月,字节旗下的AI教育产品Gauth在Google Play上下载量超79万次,并保持着高访问量。...
-
【带文字的图像生成-附开源代码】AIGC 如何在图像中准确生成文字?字体篇(上)
文字图像生成是什么? “文字图像生成(Text-image generation)”即生成带有指定文字的图像。如下图所示,市面常见的通用文生图很难准确地生成带有指定文字的图像。文字图像生成也被称为文本渲染(Text rendering)。 为什么重要?...
-
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体
当前,多模态大模型 (MLLM)在多项视觉任务上展现出了强大的认知理解能力。 然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。 比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。 定位能力的缺失直接限制了多模态...
-
Canva上线多个好用的AI设计功能:文本生成插画、自动剪辑视频精华片段
设计平台 Canva 推出了一系列更新,旨在使其设计生态系统对专业团队和工作空间更具吸引力。该公司重新设计了平台,使新的和现有的编辑工具更易于找到,并宣布推出企业版,为大型组织提供更多的协作、品牌管理和安全性控制。 大多数更新都以企业为重点,例如为品牌提...