3.8万张显卡“起死回生”：以太坊矿场转型AI算力租用的全流程拆解

以太坊合并后显卡挖矿终结，数万张GPU一度沦为“废铁”。如今，它们以极低成本杀进人工智能算力赛道，成为初创公司训练大模型的“性价比神兵”。

从矿场到机房：显卡转型三大动因

合并后的首个熊市，电费、币价双重压力让不少显卡矿场直接关机。以HIVE Blockchain为例，手握38,000张消费级GPU，挖矿收益覆盖不了运营成本，日均亏损高达数万美元。

OpenAI掀起的大模型军备赛，将GPU算力推上稀缺资源榜首。Self-GPT、Stable Diffusion等初创项目都需要短期、高并发的训练集群。传统云厂商排队动辄数月，AI创业团队被迫寻找“边缘资源”。

把矿场改造成“GPU云”几乎是零重型投入：

公司留下15%算力继续挖其他加密货币，以防下一轮牛市空降；其余85% GPU打包成Tier-3 数据中心，上架跑训练任务。

巨头云厂商往往同步推进自家大模型，存在“偷学”代码、数据泄露的潜在担忧。矿场转型AI算力后专注底层硬件，不与客户争利，简单物理隔离就能让数据驻留本地节点。

四川换流站搬过来的水电套利模式再次被用上：夜间3毛钱一度电，成本比AWS区域中心低40%。这份“水电红利”也同步让利给租赁客户，从而获取可持续的订单粘性。

显卡型号	训练时长	峰值功耗	单卡价格/日
RTX 3080 Ti	9.1h	320W	8.4元
RTX 3090	8.3h	350W	9.2元
RX 6900 XT	14.5h	300W	拒测（驱动不兼容）

性能结论：消费级型号虽不及A100，但大模型训练前端依旧够用；只要任务不是超大参数量推理，上述组合在性价比竞标中完胜。

从业者戏称：“现在卖卡的收益，不如把卡变成‘算力即服务’持续拿租金。”

虽然显卡人工智能算力便宜了，但仍需避开三大雷区：

Q1：矿场用的都是“矿渣”显卡，质量靠谱吗？
A：矿场会对GPU做一轮压力测试，淘汰掉显存和核心故障卡，良品率约92%，并提供7日内退换；所以短期跑任务完全够用，但长线生产建议搭配新卡混布。

Q2：消费级显卡能否跑大模型推理？
A：像Llama-7B量化到int4后，两张RTX 3090即可在并发10 QPS内完成稳定推理；若追求吞吐量，建议组合8卡做张量并行。

Q3：显存不足怎么办？
A：可采用4-bitQLoRA微调，显存占用从40G降至12G；另外矿场云支持多节点NVLink Bridge，分片通信延迟<10μs，不影响训练收敛。

Q4：怎样确保数据不会泄露给同一个机柜的其他租户？
A：矿场使用单卡单机的KVM隔离，并支持自加密NVMe硬盘，训练完成后可物理销毁硬盘；技术层面相当于一台小裸金属服务器。

Q5：费用会比AWS GPU Spot便宜多少？
A：官方对比1000张A100同规模的任务，矿场AI算力租用日费用约$3,200 vs. AWS按需$29,000，差一个数量级；Spot价格会波动，仍普遍贵3–4倍。

Q6：适合哪些团队？
A：预算有限、需要短期暴增深度学习算力的初创公司、高校实验室、个人开发者；若业务需要7×24 SLA且要有专属工程师驻场，建议选择Tier-4以上的传统云厂商。

从PoW到AI， GPU算力的价值从未消失，只是换了舞台。
对于矿场和开发者而言，模型训练的短期浪潮是去库存的新通道；而对于全球算力版图，亦是一次“绿色复用”的循环经济实验。谁能把每瓦电都发挥最大AI效益，谁就能在下一轮技术周期继续站在聚光灯下。