數據淘金熱:數據智能網絡DIN全解

作者:Teng Yan,Chain of Thought;翻譯:金色財經xiaozou

1、數據淘金熱

19世紀中期的加州淘金熱期間,成千上萬人在新邊疆追逐未財富希望。

窮人們突然發現自己發了財,白手起家的故事變得司空見慣,這股熱潮帶動着更多行業和城市的出現。基礎設施以驚人的速度發展,重塑了美國的面貌。

Crypto AI與淘金熱的相似之處難以忽視。

如今,大多數Crypto AI產品仍處於开發階段,要么就是在測試網上運行,表明我們正處於基礎設施建設階段。

投資者和建設者正在爲迎接潛在的增長激增做准備。現在正在創建的工具、網絡和協議可能會成爲支持龐大的去中心化人工智能生態的基礎。

我們正在見證一場數字淘金熱的早期階段——這場淘金熱可能與19世紀的淘金熱具有同樣的變革性。

所以可以想象,當我偶然發現一個自稱日活躍用戶超過70萬的Crypto AI項目時,我是有多驚訝。不是月活躍用戶,而是日活躍用戶哦。在這樣一個新興領域,這樣的用戶指標可以說是聞所未聞的。所以,我必須進行深入研究,弄清楚幕後到底發生了什么。

這是什么項目?DIN,即“數據智能網絡”。

2、加密數據網絡

我一直在密切關注Crypto AI領域裏的數據網絡,很明顯,它們正在解決AI領域的一個關鍵痛點:價值性數據集的訪問。

如今,許多最具價值的數據源都被集中實體嚴格控制着,這些實體收取高昂的訪問費用。

例如:

  • Reddit與OpenAI籤署了一份每年6000萬美元的授權協議,提供對其用戶生成內容的訪問權。

  • X(以前的Twitter)不再向开發者提供免費的API訪問,現在Twitter數據的收費在每月100美元到4.2萬美元之間(不是开玩笑)。

其中傳達的信息很明確:企業認識到數據是新的战場,他們正在鎖定控制權以實現利潤最大化。

Crypto提供了一個潛在解決方案——一種擺脫對價值性數據集的集中控制的方法。

加密數據網絡採用了一種完全不同的方法,旨在構建高質量的去中心化數據集,不存在傳統模型帶來的瓶頸。通過代幣的使用,這些網絡可以激勵大規模的數據標注工作,激勵個人爲大規模數據收集做出貢獻,甚至組織訓練數據的網絡抓取。

而區塊鏈具有透明性,創建了一個跟蹤數據的所有權和來源的框架。這便確保了每當貢獻者的數據被使用時,他們都能得到公平的補償,從而建立了一個新範式,在這個範式下,數據價值是共享的,而不是壟斷的。

3、DIN愿景

DIN是迎難而上正面處理數據問題的一個團隊。

DIN的核心是一個數據層,它收集並驗證鏈上鏈下數據,使用區塊鏈作爲結算層。

主要理念是什么?那就是將數據的所有權交還給用戶,讓他們因爲爲系統所做的貢獻而獲得獎勵。

DIN工作原理:

這個圖表可能乍看很復雜,讓我們來拆分一下。

DIN網絡有三方主要參與者:

  • 數據收集者

  • 數據驗證者

  • 計算節點

爲了更好地理解數據收集者和驗證者是如何工作的,我們來深入了解一下xData,也就是DIN目前的主產品。

(1)xData:數據收集

xData是DIN的旗艦平台,主要用來收集、組織和存儲來自X等社交媒體平台的數據,而不必依賴於API。它運行在一個去中心化網絡上,確保用戶的所有權和隱私。它於2024年4月在opBNB (BNB鏈的一個L2)上推出。

xData通過遊戲化機制讓用戶的數據收集變得具有趣味性和盈利性。下面讓我們快速了解一下它是如何工作的:

  • 用戶安裝一個瀏覽器插件,用錢包登錄並關聯他們的X账戶。

  • 用戶可以通過回復推文和tag帳戶來tag有趣的推文。

  • 用戶在tweet上tag可以獲得“wafers”積分,這些積分可以在TGE時轉換成代幣。

  • 這裏有幾種遊戲化機制。每個用戶可以tag(存儲)的推文數量有限,但他們可以通過消費wafers積分來增加存儲空間。用戶還必須每24小時消費一次wafers,以保持账戶的“解鎖”狀態,才能賺取更多wafers。

  • DIN圍繞特定的關鍵詞或標籤發布任務,社區成員實時搜索推文並根據特定標籤進行tag。

xData無需許可的特性意味着世界各地的任何一個用戶都可以參與數據收集和注釋來獲得獎勵/收入,不受國籍的限制。目前,數據收集是在鏈下進行的,被tag的推文存儲在BNB green field上,這是BNB Chain上的一個去中心化數據層。

(2)Chipper Nodes:數據驗證

下一個問題自然就是:如何確保用戶所提交數據的質量和完整性?畢竟,有人可以爲了獲取最大利益而運行一個人工智能機器人,隨機tag與指定標籤不匹配的推文。

數據標籤也不總是直截了當的。推文通常包含暱稱、俚語和文化因素——例如,比特幣在中文推文中經常被稱爲“大餅”。

這就是數據驗證的用武之地。

Chipper nodes是DIN的人工智能驅動的數據驗證和處理節點,負責驗證和向量化數據,同時也讓用戶能夠賺取代幣(xDIN和DIN)。

在幕後,每個用戶操作的節點實際上是本地運行一個小型AI模型來驗證推文的內容是否與附加標籤匹配,然後將其存儲在去中心化數據層中。用戶可以在標准PC上操作這些節點,不需要昂貴的硬件設置。

隨着處理的經驗證數據的數量越來越多,驗證者使用的人工智能模型不斷改進,使網絡隨着時間的推移變得更智能、更准確。

目前,DIN可內部處理所有數據驗證,但目標是分散驗證過程。目前正在對節點進行主動測試。用戶可以在他們的本地設備上運行節點軟件來測試網絡,DIN准備在未來幾周內發布其主網和代幣,bug獎勵已就位。

(3)計算節點

雖然計算節點還沒有投入使用,但它們卻是 DIN未來安全存儲數據的隱私計劃。以下是計算節點的工作原理:

  • 向量轉換:計算節點將經驗證的數據轉換爲向量。

  • 隱私處理:向量通過ZK(零知識)處理器處理,確保隱私。

  • 數據最終確定性:最終確定的數據集和向量存儲在IPFS中供第三方訪問。

BNB鏈上的一個新L2?

官方尚未發布公告,但在我們的研究中,我們在BNB鏈測試網上發現了一個DIN代幣。這暗示了未來區塊鏈的發展——可能是BNB鏈上的側鏈或L2解決方案。

DIN簡介:

DIN給人的感覺像是一個新玩家,但該項目的起源可以追溯到2021年底。它最初以“Web3Go”的名義推出,是Polkadot生態中的一個鏈上數據分析平台,獲得了Web3基金會的資助,並與Moonbeam和Oak Network等客戶合作。

2022年,該團隊將業務範圍擴展到BNB鏈生態,加入了幣安實驗室的MVB孵化器,並獲得了开發“多鏈开源數據分析平台”所需的投資。

到2023年7月,他們看到了徵兆:生成式人工智能正在蓬勃發展,對強大數據基礎設施的需求比以往任何時候都更加迫切。於是該團隊轉向構建一個全面的“人工智能數據智能層”,使他們的使命與人工智能創新的數據需求保持一致。這一演變在2024年5月達到高潮,屆時,Web3Go正式更名爲DIN,標志着對數據的大膽關注,預示着數據層將成爲下一波人工智能進步的關鍵。

4、DIN的牽引力——目前爲止勢頭良好

opBNB的日用戶數約爲70萬。

opBNB上的DIN日交易量約爲120萬。

根據DappBay的數據,DIN在10月份表現穩定,平均日用戶數超過70萬,日交易量超過120萬。大多數交易是因爲xData用戶必須每24小時進行一次鏈上交易,以激活他們的xData app賺取積分。

DIN一直是BNB鏈上排名前十的dApp之一,並且在很多時候,它還是網絡上用戶數排名第一的應用程序。雖然我沒有像密切關注Solana和Base這樣密切跟蹤BNB鏈生態,但這不是一個小成績,特別是考慮到BNB鏈的推出時間和幣安的強大支持。

爲了更好地理解,我分析了BNB鏈上其他一些排名靠前的應用,看看究竟是什么塑造了用戶粘性:

  • Vooi (DeFi)是一個perp DEX聚合器。

  • Particle網絡(基礎設施)是測試網中的全鏈協議。

  • Revox (基礎設施)是一個模塊化鏈上網絡,擁有一個流行的內容app——ReadON。

  • SERAPH(遊戲)是一款類似Souls的RPG遊戲。

  • MyShell是一個無代碼的AI應用商店生態。

據該團隊稱,到目前爲止,DIN已經收集並標注了超1億條推文,在opBNB和Mantle上的用戶群超過3千萬。

這裏需要注意的是,DIN能夠利用其龐大的用戶群,快速生成大量相關推文的實時數據集。這個過程完全不依賴於X API。

雖然xData目前的重心是Twitter,但該團隊計劃將數據收集和標注平台擴展到Reddit、Facebook、Instagram等其他數據源,以及任何具有高價值信息的用戶數據平台。對我來說,這才是真正的黃金所在。

Reiki:

Reiki是DIN的另一款產品,它與正在進行的AI智能體meta緊密相連。事實上,考慮到最近幾周我們在Truth Terminal和GOAT身上看到的消費者對AI智能體的潛在興趣,DIN可能已經走在了時代的前沿。

2024年1月,DIN推出了Reiki平台,用戶可以在沒有編碼經驗的情況下創建AI智能體(主要是聊天機器人)。用戶還可以整合他們自己的知識庫,建立引人入勝的、個性化的聊天機器人,這讓人想起了MyShell。

該平台一經發布便迅速獲得關注,成爲Product Hunt上排名第一的產品。

Reiki還爲創作者提供了多種方法,讓他們能夠將自己的機器人貨幣化,參與獎勵計劃,甚至將他們的機器人變成NFT——爲遊戲體驗添加了有趣的一層——所有權。值得注意的是,BNB Chain的Discord知識支持機器人是由Reiki驅動的。

雖然該平台目前基本已經被棄用,但DIN團隊並不排除在他們發布代幣後將其迎回的可能性。如果重新啓用,Reiki可以爲代幣提供額外效用,並爲AI智能體創建者提供一種方法利用xData所收集的數據。

5、代幣設計:xDINDIN和節點銷售

2024年8月至9月,DIN舉行了Chipper節點銷售並從中籌集了250萬美元。這些chipper節點將允許用戶在他們的本地設備上運行驗證軟件,使用模型來確保數據被准確標注。這次銷售非常成功,25,112個二級節點(每個售價99美元)全部售罄。

供應端:

在TGE之前,xData用戶可以將他們的wafers積分兌換爲xDIN——空投前代幣。然而,會有5-30%的兌換費,這些費用將分配給Chipper節點所有者。這種兌換機制還沒有上线,但預計在本月晚些時候節點“預挖”上线後就會立即啓動。

在TGE期間,用戶將根據其持有的xDIN比例獲得DIN(可交易代幣)空投,完全釋放,沒有復雜的鎖定機制。

在TGE之後,DIN代幣總供應的25%將保留給Chipper節點獎勵。這一配額的一半將在第一年釋放,余下的每年減半釋放。

需要注意的是,與其他進行節點銷售的項目相比,該銷售的解鎖速度是相對較快的,其他項目的節點獎勵是在3-4年內逐步分配的。

需求端:

驗證者節點可能需要質押DIN代幣才能參與網絡。作爲回報,他們將因驗證數據而獲得獎勵,但如果他們的輸出不准確,他們將面臨罰沒懲罰。

在另一端,數據使用者必須使用DIN代幣才能訪問網絡數據。由於大多數Web2企業仍對使用加密貨幣猶豫不決,該公司將需要促進這些交易,以架起傳統企業與去中心化網絡之間的橋梁。

我們仍在等待詳細的DIN代幣經濟學的公布,應該會在臨近TGE時發布。

團隊與融資:

DIN的核心團隊聚集了來自哥倫比亞大學、倫敦大學學院和斯圖加特大學的人才,他們在人工智能和區塊鏈領域擁有長達十年的專業知識。

DIN的創始人Hao Ding擁有斯圖加特大學信息技術碩士學位。在深入研究加密貨幣之前,他曾擔任中國蘇州人工智能研究所的研發主任,隨後擔任身份認證oracle網絡Litentry的副總裁,後來創立了Web3Go。

我很高興見到Hao本人,我們暢聊了人工智能的未來。如果你問我他的信念是什么?那就是:數據將是一切的核心。DIN團隊目前有16名成員,大部分都是工程師。

DIN參與了幣安實驗室的MVB 5加速器計劃,並於2023年7月在種子輪融資中籌集了400萬美元,領投的是由幣安實驗室、HashKey、NGC和Shima Capital。2024年8月,DIN獲得了另外400萬美元的融資,參投的有Manta Network, Moonbeam Network、Ankr和Maxx Capital,使其總融資額達到800萬美元。

6、我們的想法

想法1:創建一個去中心化Scale AI是件趣事

數據收集和標注是一筆大生意。

Scale AI是這一領域最知名的參與者,每年的經常性收入約爲10億美元。這是由OpenAI、Anthropic和Cohere等基礎人工智能模型公司的大量需求推動的,它們是Scale的主要客戶。截至2024年5月,該公司的估值高達140億美元。

讓我們仔細看一下Scale AI的商業模式。

Scale的數據標注任務依賴於龐大的分布式勞動力,包括手動tag視頻、分類照片和轉錄音頻。

該公司在多個國家僱傭了約24萬名工作者,並在失業率高、生活成本較低的地區積極招聘。例如,肯尼亞已成爲非洲重要的招聘中心,在內羅畢設有面授培訓的“新兵訓練營”,並有針對性地發布付費廣告吸引工作者。

標注過程通常有兩層:第一層是注釋者,他們從頭开始標注數據;第二層是質量控制者,他們檢查工作,添加缺失的標注並糾正錯誤。這是一項人力密集型工作,但卻很有效,因爲人力成本很低,而且客戶愿意支付大筆資金。

現在,想象一下通過去中心化網絡擴展這個模型。受代幣激勵的全球範圍內無需許可的工作者,可以允許任何人參與,同時,分布式驗證網絡可以確保數據的准確性和質量。去中心化可以爲擴展數據標注开闢新的可能性,將其變成一個真正的全球民主化過程。

想法2:龐大的用戶基群=好事

DIN今天的主要優勢在於其規模龐大的粘性社區,這些社區是通過兩年多的專注於社區建設的努力建立起來的。有了這樣的網絡,DIN可以根據特定標准快速調動數據收集。然而,挑战在於確定真正的數據需求在哪裏,指導用戶收集和標注正確的數據集,並建立可持續的收入流以支持長期增長。

想法3:激勵是一把雙刃劍

現在,大部分用戶粘性都是由代幣發布後對代幣獎勵的預期驅動的。但如果團隊不能在代幣發布之後爲代幣帶來足夠的需求,那么隨着最初的興趣消退,代幣使用率可能會下降。創造這種需求需要投機興趣,並建立一個由渴望購买這些數據集的消費者組成的數據消費者市場。

想法4:數據標注是一個競爭激烈的領域

DIN並不是唯一一個爭奪這一市場份額的加密團隊——像Sapiens、Grass和Masa這樣的項目也在競爭之中。但這塊蛋糕是巨大的。以GRASS爲例,該公司目前的市值爲25億美元,突顯出該行業的機會之大之多。

DIN與競對區分並脫穎而出的一個途徑可能是訓練和部署專有人工智能模型進行數據驗證,減少對人力的依賴。這種自動化優先的方法可以簡化操作,增強可擴展性,並使DIN比仍然嚴重依賴手動操作的競爭對手更具優勢。

7、結語

數據網絡是人工智能和加密交叉領域最令人興奮的一個陣地。與傳統的集中式模型不同,Crypto驅動的數據網絡利用去中心化參與和激勵機制來大規模構建高質量數據集。

DIN將自己定位爲該領域的先行者,見證這個項目的發展過程將是一件令人着迷的事。這是DIN需要抓住的機會。我經常告訴人們:數據網絡是目前最明智的建設領域之一。

Crypto正在重塑數據的收集、驗證和貨幣化方式,爲新型去中心化數據經濟奠定基礎。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

相關文章