微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

IBM的AutoAI让数据科学家更高效，但可怕的是它变得太智能了

人工智能IBM

IBM的AutoAI让数据科学家更高效，但可怕的是它变得太智能了

作者：海外来电

2022-06-07 16:33

分享至：

我对于“自动化对人工智能和机器学习生命周期的影响”这个话题很感兴趣，并与Amini博士集中讨论了AutoAI的下一代功能。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2022-06-07 16:33 • 海外来电

和数据科学。

“自动化对人工智能和机器学习生命周期的影响”这个话题很感兴趣，并与Amini博士集中讨论了AutoAI的下一代功能。

AutoAI自动执行高度复杂的任务，为数据寻找并优化最好的机器学习模型、特征和模型超参数。AutoAI完成了原本需要专业数据科学家团队和其他专业资源才能完成的工作，且速度要快得多。

图：“数据科学家想要多自动化？”（图片来源/IBM）

在模型训练开始之前，必须获取、评估数据，并对其进行预处理，以识别并纠正数据质量问题。

它需要一个训练有素的资源团队，他们要了解数据科学，还要有了解模型目的和输出的主题专家。

理和建模阶段进行无数次优化调整。

管道的高度复杂性使其成为自动化的首要对象。

自动化功能包括数据准备、模型开发、特征工程和超参数优化。

图片来源/IBM

以下是AutoAI的部分功能列表：

自动分析数据，并针对预测建模问题自动生成个性化的模型管道。
、算法和参数设置时迭代创建的。
结果显示在排行榜上，并根据问题优化目标，对自动生成的模型管道进行排名。
从数据准备，到算法选择，再到模型创建，流程的每个阶段都提供可视化。
用户只需单击鼠标，即可轻松部署模型，或为任何管道生成Python notebook。
用于持续模型改进的自动化任务，可以在需要时，将AI模型API集成到应用程序中。

只需点击几下鼠标，即使是只有基本数据科学技能的人，也可以使用自定义数据自动选择、训练并调优高性能机器学习模型。

无需从头开始编写管道代码。

未来的人工智能自动化项目

IBM Research正在开展多个下一代人工智能自动化项目，例如处理新数据类型的下一代算法，实现新的自动化质量和公平性，并显著提高规模和性能。

AutoAI for Decisions和Semantic Data Science。

用于改进决策的AutoAI

数据集的时间维度使分析变得困难并且需要更高级的数据处理。

为训练准备数据集
根据数据类型确定需要哪种模型，例如分类还是回归
将适当的插补转换器置入管道中以处理丢失的数据
通过确定哪些数据列能够最好地支持问题来进行特征选择
测试各种超参数调整选项以获得最佳结果
根据准确性和精确度等因素生成管道并对其排名。

Amini博士解释说，在许多环境中，创建时间序列预测之后，下一步是利用预测来改进决策。

例如，数据科学家可能会建立一个“时间序列预测模型”预测产品需求，但是该模型也可以作为库存补货决策的输入，通过减少成本、高昂的大量库存积压、或者避免由于库存告罄造成的销售损失，实现利润最大化。

在另一些情况下，我们会用被称为“决策优化”的更系统性方法来构建规范性模型，以补充时间序列预测模型。

然而，像AutoAI生成预测模型那样直接根据数据自动化生成决策优化管道的产品，目前还不存在。

多模型管道

这样的产品同样需要资源协作。

深度强化学习自动化

因此，它们需要大量的专业知识和手动工作对它们进行调整，以适应特定的问题和数据集。

它还可以使用高级搜索策略，为模型选择最佳的超参数配置。

该系统支持各种类型的强化学习，包括在线和离线学习以及无模型和基于模型的算法。

自动扩展人工智能

强化学习自动化解决了在企业中扩展人工智能的两个紧迫问题。

首先，它为顺序决策问题提供了自动化，在这类问题中，不确定性可能会削弱启发式甚至是不使用历史数据的正规优化模型。

其次，它为具有挑战性的强化学习模型构建领域带来了一种自动化、系统化的方法。

Semantic Data Science（语义数据科学）

自动化方法目前依靠统计技术来探索特征空间。

例如，如果数据是关于汽车的，则特征空间可能是福特、特斯拉、宝马。

尽管如此，要知道哪些特征和转换是相关的，用户必须具备足够的技术技能来破译和翻译代码和文档。

数据科学家的新语义能力

一旦AutoAI检测到正确的语义概念，程序就会使用这些概念广泛搜索现有代码、数据和文献中可能存在的相关特征和特征工程操作。

AutoAI可以使用这些新的、语义丰富的特征来提高生成模型的准确性，并通过这些生成的特征提供可供人类阅读的解释。

但是，想要理解发现的语义概念，可以使用Semantic Feature Discovery（语义特征发现）可视化资源管理器来探索发现的关系。

用户只需单击Sources超链接，即可直接从可视化资源管理器进入新功能生成的Python代码或文档，如下图所示。

甚至可以在IBM的API Hub上试用其中一些功能。

Amini博士用一句话总结了IBM对AutoAI投入的大量研究工作，并以此结束了我们的谈话：

”

要点总结

使用AutoAI可以快速大规模地生成模型。
它还将增加部署并投入运营的企业模型的数量。
AutoAI for Decisions将自动生成管道可以解决的问题类型，扩展到需要在不确定性和强化学习下进行决策优化的问题。
它将充当专家资源广泛收集并整合难以找到的、各种类型和来源的信息，从而提高在建模型的质量。
AutoAI是IBM Watson Studio的一部分。

人工智能IBM

分享至

2赞

好文章，需要你的鼓励

海外来电

科技行者旗下编译团队，聚焦海外新技术、新观点、新风向。

推荐文章

AI向善
AI for Good
AI
大模型
人工智能
NVIDIA
人形机器人
对话科技行者
DataMesh
帕西尼

2025-03-10 17:28

从技术乌托邦到问题显微镜，AI for Good正在落到实处

他们的故事揭示了一个被低估的事实：AI向善的最好载体，或许就藏工业流水线、医疗手术台、田间农作物等真实世界场景的细枝末节里。
2049集团
乡村振兴
大模型

2025-03-10 14:56

北沟村的幸福蝶变：一场时间与技术的乡村交响

春天上树剪枝；秋天打栗子；冬天在社区中心的玻璃房，烤火、赏雪......
机器人新纪元
人形机器人
大模型

2025-03-07 19:28

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

人形机器人迈入群体智能的实训2.0阶段。
阿里云
POLARDB
大模型

2025-02-28 11:01

阿里云李飞飞：将大模型，装进数据库里

“模型即算子”已经不再是一个“if”，而成了正在发生的事。

从技术乌托邦到问题显微镜，AI for Good正在落到实处

从技术乌托邦到问题显微镜，AI for Good正在落到实处

2025-03-10 17:28

北沟村的幸福蝶变：一场时间与技术的乡村交响

北沟村的幸福蝶变：一场时间与技术的乡村交响

2025-03-10 14:56

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

2025-03-07 19:28

阿里云李飞飞：将大模型，装进数据库里

阿里云李飞飞：将大模型，装进数据库里

2025-02-28 11:01

海外来电

科技行者编辑部

科技行者旗下编译团队，聚焦海外新技术、新观点、新风向。
最近文章：
- 不是苹果Vision Pro买不起，而是在MWC上的它们更有性价比
- 谁发现了超导？

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情链接

京ICP证15039648号京ICP备15039648号-9 京公网安备 11010802021500号

北京第二十六维信息技术有限公司（至顶网）版权所有。 | 联络我们

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱: jubao@zhiding.cn 　网上有害信息举报专区：https://www.12377.cn