最新AI大模型咨询与技术解读——来自DataLearnerAI

Dask分布式任务中包含写文件的方法时候，程序挂起不结束的解决方案

使用Dask进行分布式处理的时候一个最常见的场景是有很多个文件，每个文件由一个进程处理。这种操作经常会遇到一个程序挂起的问题，使得程序永远运行，无法结束。本文描述如何解决。

2020/05/08 20:25:14 阅读 2304

dask/python

pandas.DataFrame.to_csv和dask.dataframe.to_csv在windows下保存csv文件出现多个换行结果

使用pandas的DataFrame和dask的DataFrame保存数据到csv文件时候会出现两个换行符的情况。本文描述如何解决。

2020/05/08 17:20:04 阅读 3778

dask/pandas/python

dask的dataframe的值变成1和foo的解决方法

2020/05/08 14:30:53 阅读 2843

dask/python

通过命令行的方式建立Dask集群

Dask的集群启动创建也很简单，有好几种方式，最简单的是采用官方提供dask-scheduler和dask-worker命令行方式。本文描述如何使用命令行方法建立Dask集群。

2020/05/06 11:41:09 阅读 3501

dask/python/分布式编程

并行计算中如何提高处理效率——来自Dask的提示

当数据量达到一定程度，单机的处理能力会无法达到性能的要求，采用并行计算，并利用多台服务器进行分布式处理可能会提升数据处理的速度，达到性能要求。然而如果使用不当，并行处理可能并不会提升处理的速度。这篇博客介绍了Dask中关于并行处理的一些效率方面的建议，尽管是针对Dask的说明，但对于所有的并行处理来说都是适用的。

2020/03/31 15:43:31 阅读 4178

Dask/Python/分布式数据处理

Dask的本地集群配置和编程

Dask提供了多种分布式调度器，当缺少多台服务器时候，也可以通过本地集群来实现单机分布式的计算。这篇博客主要就是介绍如何实现Dask的单机分布式调度器。第一小节是简介，第二节是单机调度器的简写版本，第三节是单机调度器的完整版本，第四节是使用的一些示例。

2020/03/31 14:25:10 阅读 5207

Dask/Python/分布式处理/编程

Pandas的DataFrame选择行或者列的注意事项

Pandas中的DataFrame选择某些行和某些列是有很多中操作和选择的，不太容易记，这里整理一下。

2020/03/23 11:48:14 阅读 8071

pandas/python/编程

考虑价格和促销影响的销售预测算法实践

这是一篇来自Towards Data Science上面的一篇个人实践分享，主要是针对销量进行预测。一般来说，销量受到价格、季节等因素影响较大。这里就是考虑这些因素进行的一个实践。值得大家一试。这里我们翻译一下，并对其中的某些工作做一些简单的解释。

2020/02/15 18:16:56 阅读 4968

Prophet/python/时间序列分析/流量预测

softmax作为输出层激活函数的反向传播推导

softmax作为多标签分类中最常用的激活函数，常常作为最后一层存在，并经常和交叉熵损失函数一起搭配使用。这里描述如何推导交叉熵损失函数的推导问题。

2019/08/25 15:09:33 阅读 5327

python/人工智能/深度学习

Tensorflow中数据集的使用方法（tf.data.Dataset）

Tensorflow中tf.data.Dataset是最常用的数据集类，我们也使用这个类做转换数据、迭代数据等操作。本篇博客将简要描述这个类的使用方法。

2019/06/22 16:04:24 阅读 13832

python/tensorflow/编程

pandas的一些使用技巧

pandas的使用

2019/03/27 21:16:54 阅读 2919

pandas/Python

Microsoft Visual C++ 14.0 is required 的解决方案

Microsoft Visual C++ 14.0 is required

2019/03/27 21:15:19 阅读 3055

MicrosoftVisualC++14.0isrequired/python

网络爬虫存储数据的三种常见方式及其python实现

网络爬虫

2019/03/27 21:14:29 阅读 3458

excel/Python/TXT/数据库

用python生成随机数的几种方法

本篇博客主要讲解如何从给定参数的的正态分布/均匀分布中生成随机数以及如何以给定概率从数字列表抽取某数字或从区间列表的某一区间内生成随机数，按照内容将博客分为3部分，并附上代码。

2019/03/27 21:13:17 阅读 5129

Python/随机数生成

用python绘制散点图

如何使用python绘制简单的散点图

2019/03/27 21:13:00 阅读 6092

Python/散点图

Python中的Pickle操作（pkl文件解释）

您刚刚经历了一个耗时的过程，将一堆数据加载到python对象中。也许你从数千个网站上爬取了数据。也许你计算了pi的数值。如果您的笔记本电脑电池耗尽或python崩溃，您的信息将丢失。 Pickling允许您将python对象保存为硬盘驱动器上的二进制文件。在你pickle你的对象后，你可以结束你的python会话，重新启动你的计算机，然后再次将你的对象加载到python中。

2019/03/11 16:43:55 阅读 24598

python/序列化

argpartition/Python

Scrapy网络爬虫实战[保存为Json文件及存储到mysql数据库]

2016-09-18 16:09:09 阅读 6300

python/网络爬虫框架

python中Scrapy的安装详细过程

2016-09-18 08:34:00 阅读 2971

python/网络爬虫

python中Scrapy的安装详细过程

2016-09-18 08:30:30 阅读 2713

python/网络爬虫

python操作数据库

2016-07-21 20:52:30 阅读 2509

python/数据库

标签为 #Python# 的博客

Dask分布式任务中包含写文件的方法时候，程序挂起不结束的解决方案

pandas.DataFrame.to_csv和dask.dataframe.to_csv在windows下保存csv文件出现多个换行结果

dask的dataframe的值变成1和foo的解决方法

通过命令行的方式建立Dask集群

并行计算中如何提高处理效率——来自Dask的提示

Dask的本地集群配置和编程

Pandas的DataFrame选择行或者列的注意事项

考虑价格和促销影响的销售预测算法实践

softmax作为输出层激活函数的反向传播推导

Tensorflow中数据集的使用方法（tf.data.Dataset）

pandas的一些使用技巧

Microsoft Visual C++ 14.0 is required 的解决方案

网络爬虫存储数据的三种常见方式及其python实现

用python生成随机数的几种方法

用python绘制散点图

Python中的Pickle操作（pkl文件解释）

Ubuntu 命令行指定GPU 运行 Python 程序

使用sklearn做高斯混合聚类（Gaussian Mixture Model）

使用Python的sklearn包做kmeans

Python之numpy.argpartition

Scrapy网络爬虫实战[保存为Json文件及存储到mysql数据库]

python中Scrapy的安装详细过程

python中Scrapy的安装详细过程

python操作数据库

最新博客