音乐播放器
R1yhtp的blog
 
文章 标签
4

Powered by Gridea | Theme: Fog
载入天数...
载入时分秒...

自动化机器学习之Autogluon的安装(windows版)

- Autogluon简介

Autogluon 是由阿里巴巴集团开源的一款自动化机器学习工具库,它基于 Apache MXNet 构建。Autogluon 的目标是提供一种简单且高效的方式来解决机器学习问题,特别是对于那些没有深厚机器学习背景的用户。它通过自动化处理数据预处理、特征工程、模型选择、超参数调整等步骤,使得机器学习模型的训练和应用变得更加容易和高效。

-主要用途

  • 1.自动化模型选择:Autogluon 可以自动选择最适合当前数据集的机器学习模型,包括传统的机器学习模型和深度学习模型。

  • 2.自动化特征工程:它能够自动识别和生成有用的特征,以提高模型的性能

  • 3.超参数优化:Autogluon 可以自动调整模型的超参数,以获得最佳的性能

  • 4.集成学习:它支持集成学习,可以将多个模型的预测结果进行融合,以提高预测的准确性和稳定性

  • 5.并行计算:Autogluon 支持并行计算,可以利用多核处理器或分布式计算环境加速模型训练

  • 6.易于使用:Autogluon 提供了简单的 API 和命令行界面,使得用户可以轻松地使用它来解决机器学习问题

下面教大家怎么安装

可以使用conda安装的管理python环境
这里使用极简版miniconda3:(附下载地址与下载注意事项)
https://blog.csdn.net/weixin_43828245/article/details/124768518
建议下载3.7-3.9版本miniconda3-python,否则会导致后续出错 (亲身经历😭)

如果本身就有miniconda3不过python-version不是3.7-3.9也可以用命令conda create -n py39_env python=3.9等来创建环境

  • 步骤1--搭建Pytorch_CPU(可选)
    1.在anaconda里输入命令

    命令如下,这里使用的Python的版本为3.9:
    conda create -n PyTorch_cpu python=3.9

    构建好虚拟环境后通过命令conda activate Pytorch_cpu来进入该虚拟环境:
    conda activate Pytorch_cpu

    搭建cpu加速,方便后续下载

    2.Pytorch_CPU安装和配置
    下面我们进入到PyTorch的官网:https://pytorch.org/

    点击Get Started,进入后按照如下选择(只针对windows系统、pip安装、Python版本、无GPU的情况,如有其它需要则应该选择相应的

    下面已经自动生成了一句安装PyTorch和torchvision的命令,查看一下版本无误的话就复制这条命令并粘贴到prompt命令窗口中:

    这边是已经安装过了所以没有下载安装的过程,第一次安装会需要下载并安装,过程可能会很慢,这里建议换成国内的镜像源的快速度会得到飞速的提升。

    以上如果没有问题的话则已经安装好了cpu版的PyTorch,这时我们可以测试一下是否安装正确:

    最后我们较好使用PyTorch的IDE是pycharm,所以还需要在pycharm上设置一下解释器:
    这一步留给自己探索吧 (其实是懒了)
    附上可能用到的教程:https://blog.csdn.net/qq_38473254/article/details/132302229

  • 步骤2--安装Autogluon(必须)
    在anaconda里面输入命令即可:pip install autogluon
    如果前面安装了pytorch_CPU,可以选择加速节省下载时间,命令如下:conda activate Pytorch_cpu
    估计要下载几分钟左右....
    安装完成的界面:

  • 步骤3--安装Jupter(必须)
    命令:pip install jupyter

  • 步骤4--运行Jupter notebook(必须)
    命令:jupyter notebook
    之后会弹出网页

    我们在官网上随便找个例子运行一下:
    from autogluon.tabular import TabularDataset, TabularPredictor

    data_root = 'https://autogluon.s3.amazonaws.com/datasets/Inc/'
    train_data = TabularDataset(data_root + 'train.csv')
    test_data = TabularDataset(data_root + 'test.csv')

    predictor = TabularPredictor(label='class').fit(train_data=train_data)
    predictions = predictor.predict(test_data)



    这样,就完成了基本操作,接下来的东西以后再讲吧~😉