🧩分享|ChatGPT如何帮助您自动化机器学习?
00 分钟
2023-5-9
2023-8-26
type
status
slug
summary
date
tags
category
password
Text
AI summary
AI custom autofill
Multi-select
Status
URL
hashtag
勘误
标签
标题
类型
贴文
🪄
icon
本文介绍了 ChatGPT 如何帮助您自动化机器学习。它提供了回归、分类和聚类的实际示例,以及如何使用 ChatGPT 的说明。作者介绍了 ChatGPT 和机器学习的基本概念,并提供了线性回归、岭回归、AdaBoost 分类器、梯度提升分类器和聚类算法的示例。此外,作者还解释了准确率不是分类好评价指标的原因,并提出使用精度和召回率作为替代指标。最后,作者提供了一个关于如何使用 ChatGPT 对标题列进行 LDA 分析的示例。本文提供了有用的信息和示例,可以帮助您更好地了解 ChatGPT 并开始使用它。
 

 

回归、分类、聚类或自然语言处理。ChatGPT可帮助您使用Python自动化这些算法。

介绍

机器学习是一种迭代过程,它帮助开发人员和数据科学家编写算法以进行预测,从而使企业或个人能够相应地做出决策。
ChatGPT,正如您们中的许多人已经知道的那样,是一款聊天机器人,它将帮助人类避免进行谷歌搜索并找到他们的问题的答案。此外,由于其高昂的云开销(即Microsoft Azure),未来可能会有一个价格计划的传言。
足够的闲聊。让我们看看ChatGPT的不同用途,这将帮助您进行机器学习。
我将本文的主题分成不同的类别,并要求每个类别提供一个示例。

回归任务

假设您有一个回归任务,并想尝试5种不同的算法并同时进行评估。挑战,对吧?
让我们问问ChatGPT。
但在开始之前,让我警告您!
试着小心地问ChatGPT要什么,而且如果您不想再进行更多测试,请尝试要求ChatGPT使用内置数据集编写此代码。
现在让我们看看。

问题

(注:我添加了不使用波士顿数据集的内容,因为在使用波士顿数据集后,我得到了以下错误。)
notion image
“嗨,Chat,
我希望您编写代码,该代码将使用sci-kit-learn在内置数据集上应用5种不同的回归算法,而不使用波士顿数据集。”
好的,让我们看看ChatGPT的答案。

ChatGPT

当然,这里是一个示例,说明如何在不使用波士顿数据集的情况下使用sci-kit-learn应用5种不同的回归算法:
这段代码将使用make_regression函数生成一个合成数据集,使用train_test_split函数将此数据集拆分为训练集和测试集,然后将训练和评估5种不同的回归模型:线性回归,岭回归,Lasso回归,弹性网络回归和决策树回归。使用的评估度量是平均绝对误差和平均平方误差。
您可以根据您的数据和用例调整不同模型和评估函数的参数。

测试

现在,为了检查该代码,我在我的系统中运行了此代码;这是输出:
结果非常好,代码有效。

分类

现在我们想在分类中实现相同的内容。但这次,我希望它使用真实的内置数据集,因为当我向ChatGPT提问时,它希望将这些算法应用于合成数据集。
让我们继续。

问题

我希望您从中获得相同的内容,但这次使用6种不同算法进行分类,并使用内置的真实数据集。

ChatGPT

notion image
这里,您可以看到Chatgpt停止了。当输出很长时,它会停止。我们如何继续呢?
只需告诉它继续
notion image
现在让我们检查代码。

控制

这是完整的代码。
实际上,准确率不是分类的好评价指标。
为什么?
搜索准确率悖论。
现在让我们要求ChatGPT使用精度和召回率作为评估指标。

聚类

好的,让我们继续聚类。
我们真的需要通过各种机器学习算法。
让我们问问ChatGPT。

问题

我希望您从中获得相同的内容,但这次使用3种不同的算法进行聚类,并使用内置的真实数据集。
在这个阶段,ChatGPT已经知道您需要什么。
这是ChatGPT的答案。

ChatGPT

当然,这里是一个示例,说明如何在内置的真实数据集上使用sci-kit-learn应用3种不同的聚类算法:
现在让我们测试ChatGPT。
这真的很令人印象深刻。

自然语言处理

最近,我一直在进行个人项目,其中包括从媒体中获取数据,然后进行分析。
我从媒体中爬取了6k多篇文章。 我将数据上传到了Kaggle,这里
进行分析后,我想对标题列进行LDA分析,因此我向ChatGPT提问。

问题

嘿,我从TowardsDataScience档案中爬取了超过6k篇文章。 我希望对df2 ['title]列进行LDA分析。

ChatGPT

这是如何对从Towards Data Science档案中爬取的文本数据集的标题列执行潜在狄利克雷分配(LDA)分析的示例:

测试

在此处,您可以看到不同的主题标签集,您可以从Towards Data Science 2022标题中进行分析。

结论

在本文中,我将解释如何在机器学习中使用ChatGPT。 它确实有助于开发人员自动化机器学习任务。
感谢您阅读我的文章。

测试

这真的很令人印象深刻。

自然语言处理

最近,我一直在进行个人项目,其中包括从媒体中获取数据,然后进行分析。
我从媒体中爬取了6k多篇文章。 我将数据上传到了Kaggle,这里https://www.kaggle.com/datasets/misterg/towards-data-science-2022-articles)。
进行分析后,我想对标题列进行LDA分析,因此我向ChatGPT提问。

问题

嘿,我从TowardsDataScience档案中爬取了超过6k篇文章。 我希望对df2 ['title]列进行LDA分析。

ChatGPT

这是如何对从Towards Data Science档案中爬取的文本数据集的标题列执行潜在狄利克雷分配(LDA)分析的示例:

测试

在此处,您可以看到不同的主题标签集,您可以从Towards Data Science 2022标题中进行分析。

结论

在本文中,我将解释如何在机器学习中使用ChatGPT。 它确实有助于开发人员自动化机器学习任务。
感谢您阅读我的文章。
 

作者:Gencay I

评论