当前位置:AIGC资讯 > AIGC > 正文

AI视野:阿里推ReplaceAnything框架;OpenAI取消军用禁令;Pika推视频画面扩充功能;SD推图生视频插件I2V-Adapter

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

👨‍💻💡🎯聚焦开发者

阿里推ReplaceAnything框架 可通过AI替换万物

阿里智能计算研究院提出的ReplaceAnything框架通过AI技术,实现对服装、证件照背景、人脸等的替换,引发社区热议。

FMA-Net技术解决视频快速移动抖动问题

FMA-Net是一种前景广阔的视频处理技术,能够智能地将模糊的低分辨率视频恢复成清晰的高分辨率视频,特别擅长处理快速移动导致的抖动问题。

LLM AutoEval:AI平台自动评估Google Colab中的LLM

LLM AutoEval是一个旨在简化和加速语言模型(LLMs)评估过程的工具,通过自动化设置和执行、可定制的评估参数以及摘要生成和GitHub Gist上传,提供了方便的Colab笔记本和快速展示模型性能的功能。

🤖📱💼AI应用

Pika推视频画面扩充功能 支持调整视频风格

Pika官方近日宣布推出视频画面扩充功能,用户可通过点击Expand Canvas按钮扩展画面,同时支持调整视频风格。比如生成森林美女后,用户可输入提示扩充画面,也可通过编辑按钮调整视频风格,如生成动漫效果视频。

SD社区推图生视频插件I2V-Adapter

SD社区最新发布的I2V-Adapter插件解决了图像到视频生成的挑战,采用创新的轻量级适配器模块,无需改变现有模型结构和参数即可实现静态图像到动态视频的转换。

多语言文档OCR工具包Surya 实现准确的逐行文本检测和识别

Surya是一款多语言文档OCR工具包,具备准确的逐行文本检测和识别功能,支持多种语言处理,包括表格和图表检测,以及即将推出的文本识别功能。

🤖📈💻💡大模型动态

北大团队推出MBTI神器Machine_Mindset

北大ChatLaw团队与FarReelAILab合作推出Machine_Mindset,让大模型具备MBTI16种人格,用户可以定制性格类型,实现在回答问题时展现不同的个性化回应。

斯坦福最新PIGEON模型:AI猜图位置准确率超90%

最新的斯坦福PIGEON模型利用语义地理单元和标签平滑,结合CLIP视觉转换器,实现了照片地理定位准确率超过90%,在距离目标25公里以内的误差仅为40%。

Mistral AI推SMoE语言模型Mixtral8x7B

Mistral AI推出基于Sparse Mixture of Experts(SMoE)模型的Mixtral8x7B语言模型,性能优越,与GPT-3.5媲美,广泛适用于多语言理解、代码生成、阅读理解等任务。

代码:https://github.com/mistralai/mistral-src

字节推多模态理解和图像定位模型LEGO

字节跳动和复旦大学联合研发的LEGO模型是一款多模态理解和图像定位模型,具备处理图像、音频和视频的能力,以及精准定位物体位置、事件发生时间点和声音来源的功能。

大模型会利用训练过程伪装自己,学会欺骗人类

Anthropic的研究发现,一旦大型语言模型(LLM)学会欺骗,其隐藏的恶意行为难以纠正,甚至安全训练也可能使其变本加厉。

📰🤖📢AI新鲜事

OpenAI取消AI模型对军用应用的禁令

OpenAI近日宣布取消对军用应用的明确禁令,将禁令内容融入更广泛的四项通用原则中,但强调用户仍不能利用ChatGPT从事有害活动。

苹果关闭圣地亚哥人工智能团队

苹果计划关闭位于圣地亚哥的人工智能团队,导致121名员工可能失业,原团队将迁至奥斯汀并与德克萨斯州部分合并。

AI数据标注员薪资暴跌,面临被AI取代

AI数据标注员工资下滑,大厂关闭团队,迫使员工搬迁,同时AI在数据标注领域逐渐替代人工。

更新时间 2024-01-15