镜像复制大数据集的说明
这是复制大量数据的说明的一部分。请在继续之前阅读概述。
如果要镜像其他人发布的数据,可以按照这些说明有效地将数据复制到IPFS节点上。
相比之下,如果您的计算机上有数据集并希望将它们添加到IPFS,以便您可以通过网络提供这些数据集,请按照提供商/来源发布大型数据集的说明进行操作。
TL; DR.
如果您只是想在没有解释器的情况下运行命令,那么您需要执行此操作。以下假设您已经安装了ipfs – 您需要0.4.5或更高版本。
在执行这些步骤之前,您需要获取要复制数据的提供程序节点的多重地址(multiaddr)以及要复制的数据集的包根(Pack Root)。多重地址看起来像 /ip4/1.2.3.4/tcp/9999/ipfs/QmIpfsPackPeerId
。包根哈希看起来像QmRguPt6jHmVMzu1NM8wQmpoymM9UeqDJGXdQyU3GhiPy4
在这些指令中,这些值已被MULTIADDR-OF-PROVIDER和PACK-ROOT-HASH替换,因为它们对于每个节点都是唯一的。
ipfs init
ipfs config --json Datastore.NoSync true
ipfs config Reprovider.Interval "0"
ipfs bootstrap rm --all
ipfs bootstrap add MULTIADDR-OF-PROVIDER
# then start the daemon without auto-routing:
ipfs daemon --routing=none
# then pin the data on your node
ipfs pin PACK-ROOT-HASH
第1步:安装并初始化IPFS
如果尚未安装IPFS,请按照“分布式Web入门”中的“ 安装和初始化IPFS ”一课进行操作。 您需要ipfs版本0.4.5或更高版本。
第2步:关闭多余功能
这些参数将关闭一些对日常使用IPFS很重要的IPFS功能,但会减慢复制数据集的过程。复制数据集后,您可以重新打开它们并重新启动ipfs节点。
ipfs config --json Datastore.NoSync true
ipfs config Reprovider.Interval "0"
第3步:手动设置路由
在启动守护进程之前,请将节点配置为直接与提供数据集的主节点连接。为此,您需要该节点的多重地址。
运行这些命令时,请替换MULTIADDR-OF-PROVIDER
为提供源数据集的人员提供的多重地址。
ipfs bootstrap rm --all
ipfs bootstrap add MULTIADDR-OF-PROVIDER
第4步:关闭自动路由运行节点
确保在启动守护进程之前手动配置了路由(请参阅上一步)。
在关闭自动路由的情况下启动IPFS守护进程:
ipfs daemon --routing=none
步骤5:在您的节点上固定数据
现在,您已准备好通过将数据固定到IPFS节点来复制数据。为此,您需要数据集的根哈希。您需要从提供数据集的人那里获取PACK-ROOT-HASH
。
ipfs pin PACK-ROOT-HASH