????大模型动态
必应推出GPT-4Turbo模型
微软推出Bing Chat的最新模型,GPT-4Turbo,为用户提供更准确和最新的信息。目前仅限部分用户试用,使用方法需通过检查资格确认。
阿里团队推新AI模型I2VGen-XL
视频合成领域迎来新突破,阿里团队提出I2VGen-XL模型,通过静态图像引导实现高质量视频生成。该模型采用两阶段方法,综合考虑语义准确性和细节连续性,利用庞大数据集优化多样性和鲁棒性。
项目体验网址:https://top.aibase.com/tool/i2vgen-xl
苹果发布开源多模态机器学习模型「Ferret」
苹果与康奈尔大学合作推出的开源多模态大型语言模型「Ferret」,能够在图像中的任何位置以任何精度进行元素定位,标志着苹果在AI领域更加开放。
地址:https://top.aibase.com/tool/ml-ferret
???AI应用
抖音测试“AI搜”功能
抖音正测试名为“AI搜”的AI搜索功能,用户可通过智能搜索在APP内获得AI生成的答案,包括抖音视频和第三方网站信息。
点击体验:https://top.aibase.com/tool/doubao
小红书内测AI聊天机器人
小红书内测名为“Davinic达芬奇”的AI聊天功能,以智能问答为主,覆盖生活多方面,基于Meta的LLAMA大模型进行训练,旨在提供用户个性化的智能推荐和伴聊体验。
视频编辑工具Fairy 通过自然语言即可转换风格
Fairy是由MetaGenAI开发的视频编辑工具,支持通过自然语言指令对视频进行风格转换和物体/角色变换,速度快,可处理相对较长视频。
项目地址:https://top.aibase.com/tool/fairy
论文地址:https://arxiv.org/pdf/2312.13834.pdf
???AI新鲜事
ChatGPT领衔全球最受欢迎的AI工具
根据Writerbuddy.ai的调查,2023年被誉为AI之年,ChatGPT以超过140亿次访问量成为全球最受欢迎的生成式AI工具,尽管引起一些担忧。
OpenAI计划新一轮融资
OpenAI正处于初步谈判阶段,计划以至少1000亿美元的估值筹集新一轮融资,旨在推动其发展,特别是支持Tigris芯片项目的研发。
Gemini Pro被证实和GPT3.5差距不大
谷歌Gemini Pro与GPT-3.5进行深入比较,研究表明在多个任务上GPT-3.5几乎全面优于Gemini Pro,但整体差距不大。
论文地址:https://arxiv.org/pdf/2312.11444.pdf
谷歌考虑用人工智能取代部分员工
谷歌正考虑通过新的人工智能工具自动化广告销售等职位,可能导致一些员工被重新分配或解雇。
Humane计划于2024年3月发布基ChatGPT可佩戴设备AI Pin
Humane公司计划于2024年3月推出售价699美元的AI Pin,这是一款基于ChatGPT技术的可佩戴智能设备,旨在减少屏幕使用时间,通过语音指令、通话、信息发送、语言翻译等实现多项任务。
苹果与新闻出版机构谈判,开发生成式AI系统
苹果公司正在与主要新闻和出版机构谈判,计划以至少5000万美元的多年期协议获得新闻文章档案的授权,以开发生成式人工智能系统。
????聚焦开发者
智源开源数据集TACO
智源研究院推出TACO代码生成数据集,为模型提供更具挑战性的训练数据和评测基准,规模庞大、质量高,挑战当前流行模型,促进代码生成领域创新。
论文:https://arxiv.org/abs/2312.14852
智源开放数据仓库:https://data.baai.ac.cn/details/BAAI-TACO
Lightricks发布LongAnimatediff
Lightricks公司推出LongAnimatediff项目,解决了Animatediff一次只能生成16帧视频的限制,提供两个模型,分别能生成64帧和32帧的视频,其中效果更好的是32帧模型。
项目地址:https://github.com/Lightricks/LongAnimateDiff/
腾讯开发AppAgent 可模仿人类在手机上操作APP
腾讯与德州大学达拉斯分校合作开发的AppAgent项目利用自主学习和模仿人类手势,在手机上执行多种任务,包括社交媒体发帖、邮件编辑、地图使用、在线购物和图像编辑。该项目经过广泛测试,涵盖10种不同应用程序,具备多模态代理、直观交互、自主学习和构建知识库等功能。
项目地址:https://top.aibase.com/tool/appagent
Tracking Any Object Amodally :让AI像人一样可以追踪任何对象
该项目由卡内基梅隆大学和丰田研究所联合开发,旨在让人工智能能够像人一样,即使在部分遮挡或不完全可见的情况下,也能全面理解和追踪物体。
项目地址:https://tao-amodal.github.io/
代码:https://github.com/WesleyHsieh0806/TAO-Amodal