11月29日消息,据外媒报道,微软日前发布了ML.NET 3.0,这是该公司开源、跨平台机器学习框架的最新版本,可以将机器学习模型集成到.NET应用程序中。
ML.NET 3.0在对象检测、命名实体识别和问题回答方面包含了新的深度学习功能。通过与TorchSharp和ONNX模型的集成和互操作性,支持这些深度学习场景。3.0版本还更新了与LightGBM梯度增强框架的集成。
ML.NET 3.0还改进了对数据处理场景的支持,对DataFrame和新的IDataView互操作性特性进行了增强和BUG修复。数据的加载、检查、转换和可视化功能变得更加强大。
微软在5月份宣布了ML.NET模型构建器中的对象检测。这些功能是建立在ML.NET 3.0中引入的TorchSharp驱动的对象检测API之上的。目标检测API利用了微软研究院的一些最新技术,并由TorchSharp构建的基于Transformer的神经网络架构提供支持。目标检测包含在Microsoft ML.TorchSharp 3.0.0包中。
ML.NET 3.0还提供了自然语言处理领域,包括问答和命名实体识别。这些场景可以通过在ML.NET 2.0中引入的现有TorchSharp RoBERTa文本分类功能的基础上进行构建来解锁。ML.NET 3.0获得了新的自动机器学习(AutoML)功能,包括AutoML Sweeper,现在支持句子相似度、问题回答和对象检测。
ML.NET 3.0对DataFrame进行了更新,包括扩展了数据加载场景,现在可以从SQL数据库导入和导出数据。这是通过ADO完成的。NET,它支持SQL兼容的数据库。同样在DataFrame中,列克隆和二进制比较场景的算术性能得到了改进。在执行算术运算时改进了空值处理,在转换数据时需要更少的步骤。对调试器进行了改进,以改善具有长名称的列的可读输出。张量原语包括一组新的API来支持张量操作。
微软目前正在制定.NET 9和ML.NET 4.0的计划。与此同时,该公司表示,用户可以期待Model Builder和ML.NET CLI进行更新,以使用ML.NET 3.0版本。计划还要求扩展深度学习场景和集成,并对DataFrame进行增强。最后,微软表示将继续扩展System.Numerics.Tensors中的API,并将其集成到ML.NET中。