|
|
51CTO旗下网站
|
|
移动端
创建专栏

Python 2.7终结于7个月后,这是你需要了解的3.X炫酷新特性

在这篇文章中,作者介绍了Python 3.0 以来真正Amazing的新函数与新方法,也许这些方法我们都不太熟,但它们确实在实践中非常重要。

作者:机器之心编译|2019-05-20 10:19

许多人在了解到 Python 2.7 即将停止维护后,都开始将他们的 Python 版本从 2 切换到 3。截止到 5 月 19 号上午 10 点,Python 2.7 将终结于...

Python 3

在这一段时间中,很多优秀开源项目与库已经停止了对 2.7 的支持。例如到今年 1 月份,NumPy 将停止支持 Python 2;到今年年末,Ipython、Cython 和 Pandas 等等都将陆续停止支持 Python 2。

虽然我们都往 3.X 迁移,但许多人编写的 Python 3 代码仍然看起来像 Python 2 一样,只不过加入了一些括号或改了些 API。在本文中,作者将展示一些令人激动的 Python 3.X 新特性。这些特性或方法都是 Python 3 各个版本中新加的,它们相比传统的 Python 方法,更容易解决实践中的一些问题。

所有的示例都是在 Python 3.7 的环境下编写的,每个特性示例都给出了其正常工作所需的***的 Python 版本。

格式化字符串 f-string(*** Python 版本为 3.6)

在任何的编程语言中,不使用字符串都是寸步难行的。而为了保持思路清晰,你会希望有一种结构化的方法来处理字符串。大多数使用 Python 的人会偏向于使用「format」方法。

  1. user = "Jane Doe" 
  2. action = "buy" 
  3. log_message = 'User {} has logged in and did an action {}.'.format( 
  4.   user, 
  5.   action 
  6. print(log_message) 
  7. # User Jane Doe has logged in and did an action buy. 

除了「format」,Python 3 还提供了一种通过「f-string」进行字符串插入的灵活方法。使用「f-string」编写的与上面功能相同的代码是这样的:

  1. user = "Jane Doe" 
  2. action = "buy" 
  3. log_message = f'User {user} has logged in and did an action {action}.' 
  4. print(log_message) 
  5. # User Jane Doe has logged in and did  

相比于常见的字符串格式符 %s 或 format 方法,f-strings 直接在占位符中插入变量显得更加方便,也更好理解。

路径管理库 Pathlib(*** Python 版本为 3.4)

f-string 非常强大,但是有些像文件路径这样的字符串有他们自己的库,这些库使得对它们的操作更加容易。Python 3 提供了一种处理文件路径的抽象库「pathlib」。如果你不知道为什么应该使用 pathlib,请参阅下面这篇 Trey Hunner 编写的炒鸡棒的博文:

「https://treyhunner.com/2018/12/why-you-should-be-using-pathlib/」

  1. from pathlib import Path 
  2.  
  3. root = Path('post_sub_folder') 
  4. print(root) 
  5. # post_sub_folder 
  6.  
  7. path = root / 'happy_user' 
  8.  
  9. # Make the path absolute 
  10. print(path.resolve()) 
  11. # /home/weenkus/Workspace/Projects/DataWhatNow-Codes/how_your_python3_should_look_like/post_sub_folder/happy_user 

如上所示,我们可以直接对路径的字符串进行「/」操作,并在绝对与相对地址间做转换。

类型提示 Type hinting(*** Python 版本为 3.5)

静态和动态类型是软件工程中一个热门的话题,几乎每个人 对此有自己的看法。读者应该自己决定何时应该编写何种类型,因此你至少需要知道 Python 3 是支持类型提示的。

  1. def sentence_has_animal(sentence: str) -> bool: 
  2.   return "animal" in sentence 
  3.  
  4. sentence_has_animal("Donald had a farm without animals") 
  5. # True 

枚举(*** Python 版本为 3.4)

Python 3 支持通过「Enum」类编写枚举的简单方法。枚举是一种封装常量列表的便捷方法,因此这些列表不会在结构性不强的情况下随机分布在代码中。

  1. from enum import Enum, auto 
  2.  
  3. class Monster(Enum): 
  4.     ZOMBIE = auto() 
  5.     WARRIOR = auto() 
  6.     BEAR = auto() 
  7.  
  8. print(Monster.ZOMBIE) 
  9. # Monster.ZOMBIE 

枚举是符号名称(成员)的集合,这些符号名称与唯一的常量值绑定在一起。在枚举中,可以通过标识对成员进行比较操作,枚举本身也可以被遍历。

参考:https://docs.python.org/3/library/enum.html

  1. for monster in Monster: 
  2.     print(monster) 
  3.  
  4. # Monster.ZOMBIE 
  5. # Monster.WARRIOR 
  6. # Monster.BEAR 

原生 LRU 缓存(*** Python 版本为 3.2)

目前,几乎所有层面上的软件和硬件中都需要缓存。Python 3 将 LRU(最近最少使用算法)缓存作为一个名为「lru_cache」的装饰器,使得对缓存的使用非常简单。

下面是一个简单的斐波那契函数,我们知道使用缓存将有助于该函数的计算,因为它会通过递归多次执行相同的工作。

  1. import time 
  2.  
  3. def fib(number: int) -> int: 
  4.     if number == 0: return 0 
  5.     if number == 1: return 1 
  6.  
  7.     return fib(number-1) + fib(number-2) 
  8.  
  9. start = time.time() 
  10. fib(40) 
  11. print(f'Duration: {time.time() - start}s') 
  12. # Duration: 30.684099674224854s 

现在,我们可以使用「lru_cache」来优化它(这种优化技术被称为「memoization」)。通过这种优化,我们将执行时间从几秒降低到了几纳秒。

  1. from functools import lru_cache 
  2.  
  3. @lru_cache(maxsize=512
  4. def fib_memoization(number: int) -> int: 
  5.     if number == 0: return 0 
  6.     if number == 1: return 1 
  7.  
  8.     return fib_memoization(number-1) + fib_memoization(number-2) 
  9.  
  10. start = time.time() 
  11. fib_memoization(40) 
  12. print(f'Duration: {time.time() - start}s') 
  13. # Duration: 6.866455078125e-05s 

扩展的可迭代对象解包(*** Python 版本为 3.0)

对于这个特性,代码就说明了一切。

参考:https://www.python.org/dev/peps/pep-3132/

  1. head, *body, tail = range(5) 
  2. print(head, body, tail) 
  3. # 0 [1, 2, 3] 4 
  4.  
  5. py, filename, *cmds = "python3.7 script.py -n 5 -l 15".split() 
  6. print(py) 
  7. print(filename) 
  8. print(cmds) 
  9. # python3.7 
  10. # script.py 
  11. # ['-n', '5', '-l', '15'] 
  12.  
  13. first, _, third, *_ = range(10) 
  14. print(first, third) 
  15. # 0 2 

Data class 装饰器(*** Python 版本为 3.7)

Python 3 引入了「data class」,它们没有太多的限制,可以用来减少对样板代码的使用,因为装饰器会自动生成诸如「__init__()」和「__repr()__」这样的特殊方法。在官方的文档中,它们被描述为「带有缺省值的可变命名元组」。

  1. class Armor: 
  2.  
  3.     def __init__(self, armor: float, description: str, level: int = 1): 
  4.         self.armor = armor 
  5.         self.level = level 
  6.         self.description = description 
  7.  
  8.     def power(self) -> float: 
  9.         return self.armor * self.level 
  10.  
  11. armor = Armor(5.2, "Common armor.", 2) 
  12. armor.power() 
  13. # 10.4 
  14.  
  15. print(armor) 
  16. <__main__.Armor object at 0x7fc4800e2cf8 

使用「Data class」实现相同的 Armor 类。

  1. from dataclasses import dataclass 
  2.  
  3. @dataclass 
  4. class Armor: 
  5.     armor: float 
  6.     description: str 
  7.     level: int = 1 
  8.  
  9.     def power(self) -> float: 
  10.         return self.armor * self.level 
  11.  
  12. armor = Armor(5.2, "Common armor.", 2) 
  13. armor.power() 
  14. # 10.4 
  15.  
  16. print(armor) 
  17. # Armor(armor=5.2, description='Common armor.'level=2

隐式命名空间包(*** Python 版本为 3.3)

一种组织 Python 代码文件的方式是将它们封装在程序包中(包含一个「__init__.py」的文件夹)。下面是官方文档提供的示例。

  1. sound/                          Top-level package 
  2.       __init__.py               Initialize the sound package 
  3.       formats/                  Subpackage for file format conversions 
  4.               __init__.py 
  5.               wavread.py 
  6.               wavwrite.py 
  7.               aiffread.py 
  8.               aiffwrite.py 
  9.               auread.py 
  10.               auwrite.py 
  11.               ... 
  12.       effects/                  Subpackage for sound effects 
  13.               __init__.py 
  14.               echo.py 
  15.               surround.py 
  16.               reverse.py 
  17.               ... 
  18.       filters/                  Subpackage for filters 
  19.               __init__.py 
  20.               equalizer.py 
  21.               vocoder.py 
  22.               karaoke.py 
  23.               ... 

在 Python 2 中,上面每个文件夹都必须包含将文件夹转化为 Python 程序包的「__init__.py」文件。在 Python 3 中,随着隐式命名空间包的引入,这些文件不再是必须的了。

  1. sound/                          Top-level package 
  2.       __init__.py               Initialize the sound package 
  3.       formats/                  Subpackage for file format conversions 
  4.               wavread.py 
  5.               wavwrite.py 
  6.               aiffread.py 
  7.               aiffwrite.py 
  8.               auread.py 
  9.               auwrite.py 
  10.               ... 
  11.       effects/                  Subpackage for sound effects 
  12.               echo.py 
  13.               surround.py 
  14.               reverse.py 
  15.               ... 
  16.       filters/                  Subpackage for filters 
  17.               equalizer.py 
  18.               vocoder.py 
  19.               karaoke.py 
  20.               ... 

正如有些人说的那样,这项工作并没有像这篇文章说的那么简单,官方文档「PEP 420 Specification」指出,常规的程序包仍然需要「__init__.py」,把它从一个文件夹中删除会将该文件夹变成一个本地命名空间包,这会带来一些额外的限制。本地命名空间包的官方文档给出了一个很好的示例,并且明确指出了所有的限制。

结语

和网上几乎所有的技术列表一样,本文给出的列表也并不完整。希望这篇文章至少向你展示了一些以前不知道的 Python 3 功能,它将帮助你编写出更加干净、 直观的代码。

***,本文中给出的所有代码都可以在作者的 GitHub 上找到:

https://github.com/Weenkus/DataWhatNow-Codes/blob/master/things_you_are_probably_not_using_in_python_3_but_should/python%203%20examples.ipynb

原文链接:https://datawhatnow.com/things-you-are-probably-not-using-in-python-3-but-should/

【本文是51CTO专栏机构“机器之心”的原创译文,微信公众号“机器之心( id: almosthuman2014)”】

戳这里,看该作者更多好文

【编辑推荐】

  1. 分享 | 运营商大规模数据集群治理的实践指南
  2. 天天淘宝,你却不知道个性化推荐技术...
  3. 阿里专家:工程师快速成长的10个简单技巧
  4. 对!嫁人就嫁程序员!
  5. 抢人大战中,那些选择留在高校的AI研究员们
【责任编辑:赵宁宁 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢