NumPy数字Python开发工具由XGBoost,LightGBM以及CatBoost之类的工具实现的ML算法包括称为集成方法的统计技术, Yellowbrick和Eli5提供了机器学习可视化, NumPy是快速增长的Python可视化领域的重要组成部分,包括Matplotlib,Seaborn,Plotly,Altair,Bokeh,Holoviz,Vispy和Napari等,NumPy对大型数组的加速处理使研究人员可以可视化数据集,而原生Python无法处理,该软件具有内置的强大N维数组对象,复杂的(广播)函数以及集成的C / C ++和Fortran代码工具,有用的线性代数,傅立叶变换和随机数函数,带标签的索引多维数组,用于进行高级分析和可视化,兼容NumPy的稀疏数组库,该库与Dask和SciPy的稀疏线性代数,深度学习框架集成在一起,可以加快从研究原型到生产部署的过程,机器学习端到端平台可以轻松构建和部署基于ML的应用程序,深度学习框架适用于灵活的研究原型和生产,并用于列式内存数据和分析,跨语言开发平台,带有广播和惰性计算的多维数组用于数值分析,开发数组计算库并重新创建NumPy的基本概念,可以满足大多数用户的编程开发需求。
功能特性
分布式阵列和高级并行分析功能可以实现大规模性能。
与NumPy数组库兼容,可使用Python进行GPU加速计算。
NumPy程序的组合转换:微分,向量化和即时编译到GPU / TPU。
一个Python后端系统,可将API与实现分离; unumpy提供了一个NumPy API。
Tensor学习,代数和后端可以无缝使用NumPy,MXNet,PyTorch,TensorFlow或CuPy
强大的N维数组
NumPy向量化,索引和广播概念快速且通用,并且是当今阵列计算的实际标准。数值计算工具
NumPy提供了全面的数学功能,随机数生成器,线性代数例程,傅立叶变换等。
NumPy支持广泛的硬件和计算平台,可以很好地与分布式GPU和稀疏阵列库一起使用。演员女演员
NumPy的核心是优化的C代码。借助已编译的代码,享受Python的灵活性。易于使用
NumPy的高级语法使程序员可以从任何背景或经验水平上访问它,并提高了生产率。开源的
NumPy是在开放的BSD许可下发布的,由活跃,响应迅速且多样化的社区在GitHub上公开开发和维护。
NumPy是丰富的数据科学图书馆生态系统的核心。
典型的探索性数据科学工作流程可能如下所示:
提取,转换,加载:Pandas,Intake,PyJanitor
探索性分析:Jupyter,Seaborn,Matplotlib,Altair
建模和评估:scikit-learn,statsmodels,PyMC3,spaCy
仪表板中的报告:Dash,Panel,Voila
对于高数据量,Dask和Ray按比例缩放。
稳定的部署依赖于数据版本控制(DVC),实验跟踪(MLFlow)和工作流自动化(Airflow和Prefect)。