# 从AI数据赛道看DataFi的潜力在AI领域,我们正处于全球竞相构建最佳基础模型的时代。虽然计算能力和模型架构很重要,但真正的护城河是训练数据。本月AI圈最大的新闻是Meta展现实力,扎克伯格四处招募人才,组建了一支以华人科研人才为主的豪华AI团队。领队是28岁的Alexander Wang,他创建的Scale AI目前估值290亿美元,为包括美国军方、OpenAI、Anthropic、Meta等在内的多家AI巨头提供数据服务。Scale AI之所以能脱颖而出,是因为它早早发现了数据在AI产业中的重要性。如果将大模型比作一个人,那么模型是身体、算力是食物,而数据就是知识和信息。在大语言模型快速发展的过程中,业界的重点从模型架构转向了算力,如今数据的重要性逐渐凸显。Scale AI专注于为AI模型打造坚实的数据基础,不仅挖掘现有数据,还着眼于数据生成业务,并组建AI培训师团队为模型训练提供优质数据。模型训练分为预训练和微调两部分。预训练类似婴儿学说话,需要大量网络文本等信息;微调则像学校教育,有明确方向和目标。因此,我们需要两类数据:一类是海量但无需太多处理的数据,另一类则需精心设计和筛选,以培养模型特定能力。随着主流模型架构的确立和算力优势的逐渐失效,数据将成为大模型厂商保持竞争优势的关键。高质量、专业化的训练数据将极大影响模型能力。从长远来看,AI数据也是一个具有复利效应的赛道,数据资产会随时间积累而越发珍贵。相比传统数据公司,Web3在AI数据领域具有天然优势,由此催生了DataFi概念。Web3 DataFi的优势包括:1. 智能合约保障数据主权、安全和隐私2. 分布式架构吸引全球适合的劳动力3. 区块链提供明确的激励和结算机制4. 有利于构建高效、开放的一站式数据市场对普通用户而言,DataFi是参与去中心化AI项目的最佳切入点。用户无需昂贵硬件投入或专业技能,只需完成简单任务即可参与,如提供数据、评估模型等。目前,多个DataFi项目已获得可观融资:- Sahara AI: 融资4900万美元,打造去中心化AI基础设施和交易市场- Yupp: 融资3300万美元,专注AI模型反馈收集- Vana: 融资2300万美元,将个人数据转化为可货币化的数字资产- Chainbase: 融资1650万美元,聚焦链上数据处理- Sapien: 融资1550万美元,将人类知识转化为AI训练数据- Prisma X: 融资1100万美元,开发机器人开放协调层- Masa: 融资890万美元,Bittensor生态的数据子网项目- Irys: 融资870万美元,提供可编程数据存储和计算- ORO: 融资600万美元,致力于普通人参与AI贡献- Gata: 融资400万美元,打造去中心化数据层这些项目目前普遍壁垒不高,但早期积累用户和生态粘性至关重要。同时,它们还面临如何保证数据质量、提高透明度等挑战。DataFi的大规模应用需要吸引足够多的个人用户,同时也要获得主流企业的认可。从长远来看,DataFi代表着人类智能通过智能合约为基础,长期培育机器智能,并最终从中受益的新范式。对于那些对AI时代充满不确定性,又仍怀抱区块链理想的人来说,参与DataFi不失为一个顺势而为的选择。
AI数据赛道崛起 DataFi项目获大额融资
从AI数据赛道看DataFi的潜力
在AI领域,我们正处于全球竞相构建最佳基础模型的时代。虽然计算能力和模型架构很重要,但真正的护城河是训练数据。本月AI圈最大的新闻是Meta展现实力,扎克伯格四处招募人才,组建了一支以华人科研人才为主的豪华AI团队。领队是28岁的Alexander Wang,他创建的Scale AI目前估值290亿美元,为包括美国军方、OpenAI、Anthropic、Meta等在内的多家AI巨头提供数据服务。
Scale AI之所以能脱颖而出,是因为它早早发现了数据在AI产业中的重要性。如果将大模型比作一个人,那么模型是身体、算力是食物,而数据就是知识和信息。在大语言模型快速发展的过程中,业界的重点从模型架构转向了算力,如今数据的重要性逐渐凸显。
Scale AI专注于为AI模型打造坚实的数据基础,不仅挖掘现有数据,还着眼于数据生成业务,并组建AI培训师团队为模型训练提供优质数据。模型训练分为预训练和微调两部分。预训练类似婴儿学说话,需要大量网络文本等信息;微调则像学校教育,有明确方向和目标。因此,我们需要两类数据:一类是海量但无需太多处理的数据,另一类则需精心设计和筛选,以培养模型特定能力。
随着主流模型架构的确立和算力优势的逐渐失效,数据将成为大模型厂商保持竞争优势的关键。高质量、专业化的训练数据将极大影响模型能力。从长远来看,AI数据也是一个具有复利效应的赛道,数据资产会随时间积累而越发珍贵。
相比传统数据公司,Web3在AI数据领域具有天然优势,由此催生了DataFi概念。Web3 DataFi的优势包括:
对普通用户而言,DataFi是参与去中心化AI项目的最佳切入点。用户无需昂贵硬件投入或专业技能,只需完成简单任务即可参与,如提供数据、评估模型等。
目前,多个DataFi项目已获得可观融资:
这些项目目前普遍壁垒不高,但早期积累用户和生态粘性至关重要。同时,它们还面临如何保证数据质量、提高透明度等挑战。DataFi的大规模应用需要吸引足够多的个人用户,同时也要获得主流企业的认可。
从长远来看,DataFi代表着人类智能通过智能合约为基础,长期培育机器智能,并最终从中受益的新范式。对于那些对AI时代充满不确定性,又仍怀抱区块链理想的人来说,参与DataFi不失为一个顺势而为的选择。