首页>国内 > 正文

四个Python推导式相关的开发技巧

2022-10-08 15:59:48来源：DeepHub IMBA

对于数据科学，Python通常被广泛地用于进行数据的处理和转换，它提供了强大的数据结构处理的函数，使数据处理更加灵活，这里说的“灵活性”是什么意思?

【资料图】

这意味着在Python中总是有多种方法来实现相同的结果，我们总是有不同的方法并且需要从中选择易于使用、省时并能更好控制的方法。

要掌握所有的这些方法是不可能的。所以这里列出了在处理任何类型的数据时应该知道的4个Python技巧。

列表推导式List Comprehension是创建列表的一种优雅且最符合python语言的方法。与for循环和if语句相比，列表推导式在基于现有列表的值创建新列表时语法要短得多。因此，让我们看看该特性如何获得列表的副本。

使用列表推导式复制一个列表

有时需要创建现有列表的副本。最简单的答案是.copy()，它允许您将一个列表的内容复制到另一个(新)列表。

例如，一个由整数组成的列表original_list。

original_list = [10,11,20,22,30,34]

可以简单地使用.copy()方法复制此列表。

duplicated_list = original_list.copy()

列表推导式可以得到完全相同的输出。复制列表是理解列表推导式的最佳案例。

看看下面这段代码。

duplicated_list = [item for item in original_list]

这里并不是说复制列表使用列表推导式更好，而是说对于介绍列表推导式的工作方式，这个案例是最好的。

接下来，让我们看看对列表的每个元素执行数学运算时，列表推导式如何使工作变得简单。

列表中的元素相乘

最简单或直接的乘法方法是使用乘法运算符，即*

例如，想用一个标量(即数字5)乘以列表中的每一项。这里肯定不能使用original_list*5，因为它将创建列表的5个副本。

在这个场景中，最好的答案是列表推导式，如下所示。

original_list = [10,11,20,22,30,34] multiplied_list = [item*5 for item in original_list]  # Output [50, 55, 100, 110, 150, 170]

这里的操作并不局限乘以一个数字。可以对原始列表的每个元素执行复杂的操作。

例如，假设想计算每一项的平方根的立方，可以在一行中解决它。

multiplied_list = [math.sqrt(item)**3 for item in original_list]  # Output [31.6227766016838,  36.4828726939094,  89.4427190999916,  103.18914671611546,  164.31676725154983,  198.25236442474025]

用于计算数字平方根的函数sqrt属于库math，因此在本例中需要在使用它之前导入它。

与上面所示的内置函数类似，还可以在列表的每个元素上使用用户定义的函数。

例如如下所示的简单函数。

def simple_function(item):    item1 = item*10    item2 = item*11    return math.sqrt(item1**2 + item2**2)

可以对列表的每一项应用这个用户定义的函数。

multiplied_list = [simple_function(item) for item in original_list]  # Output [148.66068747318505,  163.52675622050356,  297.3213749463701,  327.0535124410071,  445.9820624195552,  505.4463374088292]

列表推导式在实际场景中甚至更有用。通常在分析任务中需要从列表中删除某种类型的元素，例如消0护着nan元素。列表推导式是完成这些任务的完美工具。

删除列表中的元素

根据特定条件筛选数据是选择所需数据集的常见任务之一，同样的逻辑也用于列表推导式中。

假设你有下面提到的数字列表。

original_list = [10, 22, -43, 0, 34, -11, -12, -0.1, 1]

你想要从这个列表中只保留正值。因此，从逻辑上讲，您希望只保留那些对条件项> 0求值为TRUE的项。

new_list = [item for item in original_list if item > 0]  # Output [10, 22, 34, 1]

if子句用来删除负值。可以使用if子句应用任何条件来从列表中删除任何项。

例如，当想删除所有平方小于200的项时需要做的就是在列表综合中提到条件项**2 > 200，如下所示。

new_list = [item for item in original_list if item**2 > 200]  # Output [22, -43, 34]

在处理真实的数据集时，过滤列表项的条件可能要复杂得多，这种方法既快又易于理解。

使用dict()将两个列表转换为字典键值对

有时需要从两个列表中的值创建字典。你可以使用字典推导式(dictionarycomprehension) ，而不是一个一个地输入，这是创建字典的一种优雅而简洁的方法!

它的工作原理与列表推导式完全相似，唯一的区别是——创建一个列表推导式时，你将所有内容都包含在方括号中，例如[]，而在字典推导式中，你将所有内容都包含在花括号中，例如{}。

假设有两个列表—字段和详细信息—如下所示。

fields = [‘name’, ‘country’, ‘age’, ‘gender’] details = [‘pablo’, ‘Mexico’, 30, ‘Male’]

一个简单的方法是使用像这样的字典推导式-

new_dict = {key: value for key, value in zip(fields, details)}  # Output {"name": "pablo", "country": "Mexico", "age": 30, "gender": "Male"}

这里需要理解的重要是函数zip是如何工作的。

在Python中，zip函数接受可迭代对象，如字符串、列表或字典作为输入，返回它们聚合为元组。

因此，在本例中zip已经从列表fields和details中形成了每个项的对。当字典推导式中使用key: value时，只需将此元组解包为单独的键-值对。

当使用Python中内置的dict()构造函数(用于创建字典)时，这个过程甚至会变得更快，因为dict()比字典推导式至少快1.3倍!

所以我们需要将此构造函数与zip()函数一起使用，它的语法要简单得多——dict(zip(fields，details))

总结

正如我一开始提到的，Python非常灵活，因为有多种方法可以实现相同的结果。根据任务的复杂程度需要选择最好的方法来实现它。

我希望这篇文章能对你有用。如果有任何其他方法可以做到我在本文中提到的同样的事情，请告诉我。

关键词：用户定义让我们看看构造函数可以使用

四个Python推导式相关的开发技巧

相关新闻

中山外贸展现出较强韧性前三季度全市外贸进出口2187.9亿元

做一个简易的配置中心，顺带还给整合到了SpringCloud

为什么JSON.parse会损坏大数字，如何解决这个问题？

在任期第一年每位CIO都必须完成的12件事

一次服务器非法重启后导致的故障排查记录

如何在Linux中使用xargs命令

聊聊国产数据库TiDB相关知识，你学会了吗？

什么是 CDN 缓存命中率以及如何计算和优化它？

在传统运维监控系统中加入新的预警能力

Kotlin Flow响应式编程，基础知识入门

程序员应如何理解Reactor模式？

一文掌握所有命令行，包括73个“冷门但有用”的技巧｜GitHub 11万标星之作

一文了解云计算的基本指南

LeCun转推，PyTorch GPU内存分配有了火焰图可视化工具

如何提高无线路由器的安全性

聚焦

IT

科技