区块链存数据是写入区块还是分布式账本？

咔咔 12-03 1 抢沙发

默认

摘要： 将数据打包成“区块”（Block），然后按时间顺序将这些区块用密码学方法链接成一条“链”（Chain），并分布式存储在网络的多个节点上，下面我们来详细分解这个过程，核心概念：数据是...

将数据打包成“区块”（Block），然后按时间顺序将这些区块用密码学方法链接成一条“链”（Chain），并分布式存储在网络的多个节点上。

下面我们来详细分解这个过程。

（图片来源网络，侵删）

核心概念：数据是如何被“装”进区块的？

想象一下，一个区块就像一个数据集装箱,它主要包含三个部分：

区块头
- 这是区块的“元数据”，记录了区块本身和它前一个区块的关键信息，是形成“链”的关键，它通常包含：
  - 前一个区块的哈希值：这是最重要的部分，每个区块都通过计算前一个区块头内容的哈希值来指向前一个区块，形成一条不可分割的链，如果任何一个历史区块的数据被篡改，它的哈希值就会改变，导致后续所有区块的哈希值都无效,从而立刻被网络发现。
  - 本区块的默克尔根：这是一个非常巧妙的设计，它不是直接存储所有交易数据，而是先对区块内的每笔交易数据计算哈希值，然后将这些哈希值两两配对、再计算哈希值，如此循环，最终得到一个唯一的、代表所有交易数据的“根哈希值”，这样，只需验证默克尔根，就能快速确认所有交易是否被篡改,极大提高了效率。
  - 时间戳：记录区块创建的时间。
  - 难度目标：决定了“挖矿”的难度,即网络要求计算出的哈希值必须满足特定的前导零数量。
  - 随机数：矿工通过不断尝试不同的随机数，来寻找满足难度目标的哈希值，这个过程就是“挖矿”。
区块体
- 这就是实际存储数据的地方，在公有链（如比特币、以太坊）中，这里主要存储的是交易数据，在比特币上，区块体里记录了“A转给B 0.1个比特币”这样的交易信息。
- 重要提示：并非所有数据都适合直接存在区块体里，区块大小有限，且存储成本高（尤其是需要支付矿工费），所以通常只存储关键的小数据（如交易信息、智能合约代码等）。
区块编号
（图片来源网络，侵删）

简单的序列号,用于标识区块在链中的位置。

数据的写入流程：如何“上链”？

数据从产生到被永久记录在区块链上，需要经过一个严格的共识过程，以防止恶意行为，以比特币和以太坊为例,这个过程大致如下：

发起交易/数据：用户创建一笔交易（或数据），并用私钥进行数字签名，证明所有权和操作意图,这个交易被广播到整个区块链网络。
节点验证：网络中的每个节点（全节点）都会收到这个交易,并验证其合法性，
（图片来源网络，侵删）
- 签名是否有效？
- 发送者是否有足够的余额？
- 格式是否正确？
打包成区块：网络中的“矿工”节点（在PoW机制下）会收集一段时间内被验证通过的所有有效交易,将它们打包成一个候选区块。
共识机制（核心步骤）：这是区块链去中心化的精髓，矿工们需要通过竞争来解决一个复杂的数学难题（即“挖矿”）,第一个解决问题的矿工获得记账权。
- 工作量证明：如比特币，矿工们用强大的计算能力不断尝试不同的随机数，使得区块头的哈希值满足预设的难度条件,这个过程非常消耗算力和能源。
- 权益证明：如以太坊，矿工（验证者）需要质押一定数量的加密货币，然后根据质押数量和其他因素，按照算法规则随机选择谁来创建下一个区块,这更节能。
- 其他共识机制还有：委托权益证明、实用拜占庭容错等。
广播与确认：赢得记账权的矿工将新广播到整个网络，其他节点收到后，会再次验证这个新区块的有效性，如果多数节点都认为有效，这个新区块就被正式添加到链上,成为链的一部分。
数据永久存储：一旦新区块被添加，并且后续又新增了多个区块（通常经过6个区块确认后），这个区块内的数据就被认为是不可篡改的、永久性的，因为要修改它，需要重新计算之后所有区块的哈希值,这在计算上是几乎不可能的。

数据存储在哪里？

这是区块链与传统数据库最大的区别之一：分布式存储。

全节点：网络中维护了完整区块链副本的节点，它们存储了从创世区块到当前最新区块的所有数据，这是区块链数据最完整、最权威的存储方式,比特币网络有数万个全节点。
轻节点：只存储区块头，不存储完整的交易数据，它们通过查询全节点来获取交易信息，从而验证交易的有效性,同时节省了大量的存储空间。
中心化/去中心化存储方案：
- 问题：如前所述，将大量数据（如图片、视频、大文件）直接放在区块体里非常昂贵且不现实。
- 解决方案：采用“链上存储索引，链下存储数据”的混合模式。
  - 链上：只存储一个指向数据的哈希值或指针，这个哈希值就像是数据的“数字指纹”。
  - 链下：将实际的大文件数据存储在去中心化存储网络中，如 IPFS（星际文件系统） 或 Arweave，或者传统的中心化云存储（如AWS, Google Cloud）。
- 优点：大大降低了链上存储成本，同时利用哈希值保证了链下数据的不可篡改性，任何人都可以用链上的哈希值去IPFS上验证下载的文件是否是原始的、未被修改过的。

不同区块链的数据存储特点

区块链类型	存储方式	数据类型	优点	缺点
公有链 (如比特币)	完全去中心化，所有节点共同维护	主要存储交易记录（价值转移）	高度安全、抗审查、去信任	交易速度慢、存储成本高、隐私性弱（交易公开）
联盟链 (如Hyperledger Fabric)	预选节点共同维护，权限控制	企业间数据、供应链信息、身份信息	高效、可扩展、隐私性好（数据可加密）	去中心化程度较低，存在准入机制
私有链	单一组织或机构控制	内部审计、数据存证	完全控制、高性能、成本低	中心化程度高，信任依赖于单一组织
以太坊及智能合约平台	分布式存储，支持智能合约	交易数据、智能合约代码、状态数据	图灵完备，可编程，支持复杂应用	每笔交易都需要Gas费，存储同样昂贵
Layer 2扩容方案 (如Arbitrum, Optimism)	主链存储数据，侧链处理计算	主链存储交易证明，侧链存储详细数据	大幅降低主网拥堵和成本，提高速度	依赖主链的安全性，架构更复杂