Python中dataclass库A

作者：1986欠我一个拥抱_567 | 来源：互联网 | 2023-02-01 20:04

dataclass语法一、简介官方文档的地址为：https:docs.python.org3.9librarydataclasses.htmldataclass的

Python中dataclass库 - A

dataclass语法
- 一、简介
- 二、装饰器参数
- 三、数据属性
  - 1、参数
  - 2、使用示例
  - 3、注意事项
- 四、其他
  - 1、常用函数
  - 2、继承
  - 3、总结

dataclass语法

一、简介

官方文档的地址为：https://docs.python.org/3.9/library/dataclasses.html

dataclass的定义位于PEP-557，根据定义一个dataclass是指“一个带有默认值的可变的namedtuple”，广义的定义就是有一个类，它的属性均可公开访问，可以带有默认值并能被修改，而且类中含有与这些属性相关的类方法，那么这个类就可以称为dataclass，再通俗点讲，dataclass就是一个含有数据及操作数据方法的容器。

乍一看可能会觉得这个概念不就是普通的class么，然而还是有几处不同：

相比普通class，dataclass通常不包含私有属性，数据可以直接访问
dataclass的repr方法通常有固定格式，会打印出类型名以及属性名和它的值
dataclass拥有__eq__和__hash__魔法方法
dataclass有着模式单一固定的构造方式，或是需要重载运算符，而普通class通常无需这些工作

我们来创建一个实例：

from dataclasses import dataclass

@dataclass
class InventoryItem:
    """Class for keeping track of an item in inventory."""
    name: str
    unit_price: float
    quantity_on_hand: int = 0

    def total_cost(self) -> float:
        return self.unit_price * self.quantity_on_hand

同时，我们也可以添加__init__方法：

def __init__(self, name: str, unit_price: float, quantity_on_hand: int = 0):
    self.name = name
    self.unit_price = unit_price
    self.quantity_on_hand = quantity_on_hand

同时使用dataclass也有一些好处，它比namedtuple更灵活。同时因为它是一个常规的类，所以你可以享受继承带来的便利。

二、装饰器参数

参数为dataclass()：

init：如果为true（默认），__init__()将生成一个方法。

如果类已经定义__init__()，则忽略此参数。
repr：如果为true（默认），__repr__()将生成一个方法。生成的 repr 字符串将具有类名以及每个字段的名称和 repr，按照它们在类中定义的顺序。不包括标记为从 repr 中排除的字段。例如：。InventoryItem(name="widget", unit_price=3.0, quantity_on_hand=10)

如果类已经定义__repr__()，则忽略此参数。
eq：如果为true（默认），__eq__()将生成一个方法。此方法按顺序比较类，就好像它是其字段的元组一样。比较中的两个实例必须是相同的类型。

如果类已经定义__eq__()，则忽略此参数。
order: 如果为真（默认为False），将生成__lt__()、 __le__()、__gt__()和方法。__ge__()这些按顺序比较类，就好像它是其字段的元组一样。比较中的两个实例必须是相同的类型。如果order为真且eq为假， ValueError则引发 a。

如果该类已经定义了__lt__()、 __le__()、__gt__()或中的任何一个，__ge__()则 TypeError引发。
unsafe_hash：if False（默认），__hash__()根据how eqand frozenare set生成一个方法。

__hash__()由 built-in 使用hash()，并且在将对象添加到散列集合（例如字典和集合）时使用。拥有 a __hash__()意味着类的实例是不可变的。可变性是一个复杂的属性，它取决于程序员的意图、的存在和行为，以及装饰器中的和标志__eq__()的值。eq``frozendataclass()

默认情况下，除非这样做是安全的，否则dataclass()不会隐式添加方法。__hash__()它也不会添加或更改现有的明确定义的__hash__()方法。如文档中所述，设置类属性对 Python 具有特定含义。__hash__ = None__hash__()

如果__hash__()没有显式定义，或者如果设置为None，则可以添加隐式方法。虽然不推荐，但您可以强制使用 . 如果您的类在逻辑上是不可变的，但仍然可以发生变异，则可能会出现这种情况。这是一个专门的用例，应该仔细考虑。dataclass() __hash__()dataclass()__hash__()unsafe_hash=True

以下是管理方法隐式创建的规则__hash__() 。请注意，您不能__hash__() 在数据类和 set 中都有显式方法unsafe_hash=True；这将导致一个TypeError.

如果eq和frozen都为真，默认情况下dataclass()会为你生成一个__hash__()方法。如果eq为真且 frozen为假，__hash__()将设置为None，将其标记为不可散列（它是，因为它是可变的）。如果eq为假， __hash__()将保持不变，这意味着__hash__() 将使用超类的方法（如果超类是 object，这意味着它将回退到基于 id 的散列）。
frozen：如果为真（默认为False），分配给字段将产生异常。这模拟只读冻结实例。如果 __setattr__()或__delattr__()在类中定义，则 TypeError引发。

@dataclass
class C:
    ...

@dataclass()
class C:
    ...

@dataclass(init=True, repr=True, eq=True, order=False, unsafe_hash=False, frozen=False)
class C:
   ...

三、数据属性

1、参数

参数为field()：

default：如果提供，这将是该字段的默认值。这是必需的，因为field()调用本身会替换默认值的正常位置。
default_factory：如果提供，它必须是一个零参数的可调用对象，当该字段需要默认值时将被调用。除其他目的外，这可用于指定具有可变默认值的字段，如下所述。default同时指定和是错误的default_factory。
init：如果为 true（默认值），则此字段作为参数包含在生成的__init__()方法中。
repr：如果为true（默认），则该字段包含在生成的__repr__()方法返回的字符串中。
compare: 如果为 true（默认值），则该字段包含在生成的相等和比较方法中（__eq__()、、 __gt__()等）。
hash: 这可以是 bool 或None. 如果为 true，则此字段包含在生成的__hash__()方法中。如果None（默认），使用compare: 这通常是预期的行为。如果某个字段用于比较，则应在哈希中考虑该字段。None不鼓励将此值设置为除此之外的任何值。

hash=False设置的一个可能原因compare=True 是，如果一个字段计算哈希值的成本很高，则需要该字段进行相等性测试，并且还有其他字段有助于该类型的哈希值。即使某个字段从哈希中排除，它仍将用于比较。
metadata：这可以是映射或无。None 被视为空字典。这个值被包装 MappingProxyType()成只读的，并暴露在Field对象上。数据类根本不使用它，而是作为第三方扩展机制提供的。多个第三方可以各自拥有自己的密钥，用作元数据中的命名空间。

2、使用示例

@dataclass
class C:
    x: int
    y: int = field(repr=False)
    z: int = field(repr=False, default=10)
    t: int = 20

3、注意事项

init参数如果设置为False，表示不为这个field生成初始化操作，dataclass提供了hook——__post_init__供我们利用这一特性：

@dataclass
class C:
    a: int
    b: int
    c: int = field(init=False)
 
    def __post_init__(self):
        self.c = self.a + self.b

__post_init__在__init__后被调用，我们可以在这里初始化那些需要前置条件的field。

repr参数表示该field是否被包含进repr的输出，compare和hash参数表示field是否参与比较和计算hash值。metadata不被dataclass自身使用，通常让第三方组件从中获取某些元信息时才使用，所以我们不需要使用这一参数。

如果指定一个field的类型注解为dataclasses.InitVar，那么这个field将只会在初始化过程中（__init__和__post_init__）可以被使用，当初始化完成后访问该field会返回一个dataclasses.Field对象而不是field原本的值，也就是该field不再是一个可访问的数据对象。举个例子，比如一个由数据库对象，它只需要在初始化的过程中被访问：

@dataclass
class C:
    i: int
    j: int = None
    database: InitVar[DatabaseType] = None
 
    def __post_init__(self, database):
        if self.j is None and database is not None:
            self.j = database.lookup("j")
 
c = C(10, database=my_database)

四、其他

1、常用函数

dataclasses模块中提供了一些常用函数供我们处理数据类。

使用dataclasses.asdict和dataclasses.astuple我们可以把数据类实例中的数据转换成字典或者元组：

>>> from dataclasses import asdict, astuple
>>> asdict(C())
{"name": "python", "strong_type": True, "static_type": False, "age": 28}
>>> astuple(C())
("python", True, False, 28)

使用dataclasses.is_dataclass可以判断一个类或实例对象是否是数据类

2、继承

dataclass装饰器会检查当前class的所有基类，如果发现一个dataclass，就会把它的字段按顺序添加进当前的class，随后再处理当前class的field。所有生成的方法也将按照这一过程处理，因此如果子类中的field与基类同名，那么子类将会无条件覆盖基类。子类将会根据所有的field重新生成一个构造函数，并在其中初始化基类。

看个例子：

@dataclass
class Base:
    x: float = 25.0
    y: int = 0
 
@dataclass
class C(Base):
    z: int = 10
    x: int = 15
 
>>> C()
C(x=15, y=0, z=10)

C中的x则覆盖了Base中的定义

3、总结

合理使用dataclass将会大大减轻开发中的负担，将我们从大量的重复劳动中解放出来，这既是dataclass的魅力，不过魅力的背后也总是有陷阱相伴，最后我想提几点注意事项：

dataclass通常情况下是unhashable的，因为默认生成的__hash__是None，所以不能用来做字典的key，如果有这种需求，那么应该指定你的数据类为frozen dataclass
小心当你定义了和dataclass生成的同名方法时会引发的问题
当使用可变类型（如list）时，应该考虑使用field的default_factory
数据类的属性都是公开的，如果你有属性只需要初始化时使用而不需要在其他时候被访问，请使用dataclasses.InitVar

只要避开这些陷阱，dataclass一定能成为提高生产力的利器。

推荐阅读

安全
Final关键字的含义及用法详解

本文详细介绍了Java中final关键字的含义和用法。final关键字可以修饰非抽象类、非抽象类成员方法和变量。final类不能被继承，final类中的方法默认是final的。final方法不能被子类的方法覆盖，但可以被继承。final成员变量表示常量，只能被赋值一次，赋值后值不再改变。文章还讨论了final类和final方法的应用场景，以及使用final方法的两个原因：锁定方法防止修改和提高执行效率。 ... [详细]

蜡笔小新 2023-12-14 18:07:46
io
使用在线工具jsonschema2pojo根据json生成java对象

本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具，用户只需将json字符串复制到输入框中，即可自动将其转换成java对象。该工具还能解析列表式的json数据，并将嵌套在内层的对象也解析出来。本文以请求github的api为例，展示了使用该工具的步骤和效果。 ... [详细]

蜡笔小新 2023-12-13 21:23:45
version
JDK源码学习之HashTable(附带面试题)的学习笔记

本文介绍了JDK源码学习之HashTable(附带面试题)的学习笔记，包括HashTable的定义、数据类型、与HashMap的关系和区别。文章提供了干货，并附带了其他相关主题的学习笔记。 ... [详细]

蜡笔小新 2023-12-12 13:05:17
io
Java面经整理及相关概念解析

本文整理了Java面试中常见的问题及相关概念的解析，包括HashMap中为什么重写equals还要重写hashcode、map的分类和常见情况、final关键字的用法、Synchronized和lock的区别、volatile的介绍、Syncronized锁的作用、构造函数和构造函数重载的概念、方法覆盖和方法重载的区别、反射获取和设置对象私有字段的值的方法、通过反射创建对象的方式以及内部类的详解。 ... [详细]

蜡笔小新 2023-12-10 22:17:08
io
如何自行分析定位SAP BSP错误

The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]

蜡笔小新 2023-12-14 19:58:05
io
阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾

本文介绍了阿里Treebased Deep Match(TDM)的学习笔记，同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法，再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用，并介绍了TDM的背景和优势。最后，文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]

蜡笔小新 2023-12-14 19:24:58
io
计算机网络初识及通信流程分析

本文介绍了计算机网络的定义和通信流程，包括客户端编译文件、二进制转换、三层路由设备等。同时，还介绍了计算机网络中常用的关键词，如MAC地址和IP地址。 ... [详细]

蜡笔小新 2023-12-13 16:50:29
select
模板引擎StringTemplate的使用方法和特点

本文介绍了模板引擎StringTemplate的使用方法和特点，包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时，还介绍了StringTemplate语法中的属性和普通字符的使用方法，并提供了向模板填充属性的示例代码。 ... [详细]

蜡笔小新 2023-12-11 21:45:03
select
Java程序设计第4周学习总结及注释应用的开发笔记

本文由编程笔记#小编为大家整理，主要介绍了201521123087《Java程序设计》第4周学习总结相关的知识，包括注释的应用和使用类的注释与方法的注释进行注释的方法，并在Eclipse中查看。摘要内容大约为150字，提供了一定的参考价值。 ... [详细]

蜡笔小新 2023-12-11 21:21:22
version
to_a和to_ary有什么区别？ - What's the difference between to_a and to_ary?

Whatsthedifferencebetweento_aandto_ary?to_a和to_ary有什么区别？ ... [详细]

蜡笔小新 2023-12-11 19:30:04
io
PHP调用实现波场交互[支持TRX/TRC20]的开发包

本文介绍了一个适用于PHP应用快速接入TRX和TRC20数字资产的开发包，该开发包支持使用自有Tron区块链节点的应用场景，也支持基于Tron官方公共API服务的轻量级部署场景。提供的功能包括生成地址、验证地址、查询余额、交易转账、查询最新区块和查询交易信息等。详细信息可参考tron-php的Github地址：https://github.com/Fenguoz/tron-php。 ... [详细]

蜡笔小新 2023-12-11 17:02:09
bit
微软的STL容器类实现是否线程安全？

本文讨论了微软的STL容器类是否线程安全。根据MSDN的回答，STL容器类包括vector、deque、list、queue、stack、priority_queue、valarray、map、hash_map、multimap、hash_multimap、set、hash_set、multiset、hash_multiset、basic_string和bitset。对于单个对象来说，多个线程同时读取是安全的。但如果一个线程正在写入一个对象，那么所有的读写操作都需要进行同步。 ... [详细]

蜡笔小新 2023-12-11 11:53:23
io
HashMap的相关问题及其底层数据结构和操作流程

本文介绍了关于HashMap的相关问题，包括其底层数据结构、JDK1.7和JDK1.8的差异、红黑树的使用、扩容和树化的条件、退化为链表的情况、索引的计算方法、hashcode和hash()方法的作用、数组容量的选择、Put方法的流程以及并发问题下的操作。文章还提到了扩容死链和数据错乱的问题，并探讨了key的设计要求。对于对Java面试中的HashMap问题感兴趣的读者，本文将为您提供一些有用的技术和经验。 ... [详细]

蜡笔小新 2023-12-10 17:07:36
perl
pack布局管理器的使用方法及注意事项

本文介绍了pack布局管理器在Perl/Tk中的使用方法及注意事项。通过调用pack()方法，可以控制部件在显示窗口中的位置和大小。同时，本文还提到了在使用pack布局管理器时，应注意将部件分组以便在水平和垂直方向上进行堆放。此外，还介绍了使用Frame部件或Toplevel部件来组织部件在窗口内的方法。最后，本文强调了在使用pack布局管理器时，应避免在中间切换到grid布局管理器，以免造成混乱。 ... [详细]

蜡笔小新 2023-12-10 16:03:24
stream
在泛型字典类中使用foreach

本文介绍了在实现了System.Collections.Generic.IDictionary接口的泛型字典类中如何使用foreach循环来枚举字典中的键值对。同时还讨论了非泛型字典类和泛型字典类在foreach循环中使用的不同类型，以及使用KeyValuePair类型在foreach循环中枚举泛型字典类的优势。阅读本文可以帮助您更好地理解泛型字典类的使用和性能优化。 ... [详细]

蜡笔小新 2023-12-09 09:22:34