除了猴子圖片難以想象的價格之外, NFT 的底層技術(shù)為公司提供了一條直接將其在線業(yè)務(wù)盈利的新途徑。主要品牌,如: 阿迪達(dá)斯 , 美國籃球職業(yè)聯(lián)盟 和 TIME 我們已經(jīng)開始使用非金融交易系統(tǒng)對這些收入流進行實驗——我們還處于這一趨勢的早期。
作為數(shù)據(jù)從業(yè)者,鑒于所有交易在區(qū)塊鏈上都是公開的,我們將為這些收入流提供有價值的見解。這篇文章提供了一個引導(dǎo)項目,使用 Python 訪問、分析和識別使用區(qū)塊鏈數(shù)據(jù)的潛在欺詐。
在這篇文章中 隨附 Jupyter 筆記本 為此,我將討論以下內(nèi)容:
區(qū)塊鏈、 NFT 和網(wǎng)絡(luò)圖的基礎(chǔ)知識。
如何使用來自 a16z 的開源軟件包 NFT Analyst Starter Pack 提取 NFT 數(shù)據(jù)。
如何解釋以太坊區(qū)塊鏈數(shù)據(jù)。
非金融交易的欺詐行為。
構(gòu)建網(wǎng)絡(luò)圖,以可視化 NFT 項目 Bored Ape 游艇俱樂部的潛在清洗交易。
Jupyter 筆記本有一個更詳細(xì)、分步的指南,用于編寫 Python 代碼來實現(xiàn)這個示例演練,本文提供了額外的上下文。此外,本文假設(shè)您對以下內(nèi)容有基本了解: pandas 、數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)可視化。
什么是區(qū)塊鏈數(shù)據(jù)?
在以狗命名的硬幣和像素化圖片以數(shù)十萬美元的價格出售的媒體熱潮中,我們發(fā)現(xiàn)了一種迷人的技術(shù):區(qū)塊鏈。
以下摘錄最能描述這種分散的數(shù)據(jù)源:
“在非常高的層次上,區(qū)塊鏈?zhǔn)抢眉用芗夹g(shù)的交易分類賬,只能添加信息,因此無法更改(即不變)。將區(qū)塊鏈與銀行賬本區(qū)分開來的是一個稱為“去中心化”的概念,即連接到各個區(qū)塊鏈的每臺計算機必須“同意”區(qū)塊鏈的相同狀態(tài)以及添加到其中的后續(xù)數(shù)據(jù)。”
有關(guān)以太坊區(qū)塊鏈數(shù)據(jù)的更多信息,請參閱 利用以太坊數(shù)據(jù)進行分析 。
這項技術(shù)的核心是所有數(shù)據(jù)(例如,日志、元數(shù)據(jù)等)都必須是公共的和可訪問的。我強烈推薦斯坦福大學(xué)教授 丹·博內(nèi)的閱讀 。
什么是 NFT ?
NFT 代表不可替代代幣,區(qū)塊鏈(如以太坊)上的加密資產(chǎn),其中它代表可以數(shù)字擁有的唯一令牌。例如,金條是可替代的,因為多個金條可以存在并代表同一件事,而蒙娜麗莎原作是不可替換的,因為只有一個金條存在。
與普遍的看法相反, NFT 不僅僅是藝術(shù)和 JPEG ,而是區(qū)塊鏈賬本上唯一項目所有權(quán)的數(shù)字表示,如藝術(shù)、音樂,或 NFT 創(chuàng)建者想要放在元數(shù)據(jù)上的任何東西。然而,在這篇文章中,我們使用了 NFT 項目 Bored Ape Yacht Club ( BAYC ),這是一個藝術(shù)品 NFT 。
P 、 如果你是一名視覺學(xué)習(xí)者,我最喜歡的關(guān)于 NFT 主題的介紹資源是 什么是非金融交易?如何將其用于分散金融?迪菲解釋道 Finematics 的視頻。
什么是網(wǎng)絡(luò)圖,為什么它們代表區(qū)塊鏈數(shù)據(jù)?
網(wǎng)絡(luò)是一種組織關(guān)系數(shù)據(jù)的方法,使用節(jié)點和邊緣。節(jié)點表示實體,如電子郵件地址或社交媒體帳戶,而邊緣表示節(jié)點之間的連接。
此外,可以存儲節(jié)點和邊的元數(shù)據(jù),以表示關(guān)系的不同方面。元數(shù)據(jù)的范圍可以從權(quán)重到標(biāo)簽。圖 1 顯示了獲取整個網(wǎng)絡(luò)并使用元數(shù)據(jù)中的有用標(biāo)簽放大到用例的步驟。
圖 1.本文中創(chuàng)建的各種網(wǎng)絡(luò)圖
使網(wǎng)絡(luò)圖成為表示區(qū)塊鏈交易的理想工具的是,始終存在一個到和從…起區(qū)塊鏈地址,以及每個交易的重要元數(shù)據(jù)(例如,時間戳、硬幣金額等)。此外,由于區(qū)塊鏈數(shù)據(jù)通過分散設(shè)計是公開的,因此您可以使用網(wǎng)絡(luò)圖來可視化各個區(qū)塊鏈上的經(jīng)濟行為。
在本例中,我想演示如何識別洗牌交易也就是說,個人故意通過多個賬戶向自己出售資產(chǎn),以人為抬高資產(chǎn)價格。
ChainAnalysis 寫了一份出色的報告 關(guān)于這一現(xiàn)象,他們發(fā)現(xiàn)了 260 多個以太坊加密錢包可能參與洗牌交易,僅 2021 一年的總利潤就超過 840 萬美元。
從以太坊區(qū)塊鏈中提取數(shù)據(jù)
盡管所有區(qū)塊鏈數(shù)據(jù)對任何人都是公開的,但訪問和準(zhǔn)備分析仍然很困難。以下是訪問區(qū)塊鏈數(shù)據(jù)的一些選項:
創(chuàng)建您自己的區(qū)塊鏈節(jié)點(例如,成為礦工)以讀取可用的最原始數(shù)據(jù)。
使用第三方工具創(chuàng)建您自己的區(qū)塊鏈節(jié)點。
使用第三方 API 從自己的區(qū)塊鏈節(jié)點讀取原始數(shù)據(jù)。
使用第三方 API 從其服務(wù)讀取清理和聚合的區(qū)塊鏈數(shù)據(jù)。
使用開源軟件包 NFT 分析師入門包 從 a16z 開始。
盡管所有這些都是可行的選擇,但每種選擇都在可靠性、信任和便利性之間進行權(quán)衡。
例如,我參與了一個 NFT 分析項目,我們希望創(chuàng)建一個可靠的 NFT 市場儀表盤。不幸的是,擁有我們自己的區(qū)塊鏈節(jié)點成本高昂,許多第三方數(shù)據(jù)源存在我們無法控制的各種數(shù)據(jù)質(zhì)量問題,因此跨多個區(qū)塊鏈跟蹤交易變得非常困難。該項目最終需要匯集來自眾多第三方 API 的高質(zhì)量數(shù)據(jù)。
謝天謝地,對于這個項目,您希望盡可能方便地專注于學(xué)習(xí),因此我推薦您 來自 a16z 的 NFT 分析師入門包 。將此軟件包視為第三方區(qū)塊鏈 API 的方便包裝 Alchemy ,它可以為您所需的 NFT 合同創(chuàng)建易于使用的 CSV 。
準(zhǔn)備數(shù)據(jù)和創(chuàng)建網(wǎng)絡(luò)圖
NFT Analyst Starter Pack 為 BAYC NFT 項目生成了三個單獨的 CSV 文件:
貝葉斯元數(shù)據(jù):關(guān)于特定 NFT 的信息,其中asset_id是該 NFT 令牌內(nèi)的唯一標(biāo)識符。
BAYC 銷售:與特定交易相關(guān)的日志和元數(shù)據(jù),由其交易哈希表示,其中賣方和買方通知您所涉及的錢包。
BAYC 傳輸:與 BAYC 銷售數(shù)據(jù)相同,但沒有資金從一個錢包轉(zhuǎn)移到另一個錢包。
對于本項目,大部分?jǐn)?shù)據(jù)準(zhǔn)備工作圍繞著:
重新組織 BAYC 銷售和 BAYC 傳輸,以實現(xiàn)兩個數(shù)據(jù)集的干凈合并。
刪除已在銷售中表示的轉(zhuǎn)賬交易的重復(fù)日志。
鑒于目標(biāo)是學(xué)習(xí),不必?fù)?dān)心區(qū)塊鏈數(shù)據(jù)是否準(zhǔn)確,但您始終可以通過搜索上的transaction_hash值來檢查自己 Ethercan 。
準(zhǔn)備好數(shù)據(jù)后,使用 NetworkX 軟件包 生成 NFT 事務(wù)的網(wǎng)絡(luò)圖數(shù)據(jù)結(jié)構(gòu)。構(gòu)造圖有多種方法,但在我看來,最直接的方法是使用函數(shù)from_pandas_edgelist,其中,您只需提供 pandas 數(shù)據(jù)幀、to和from值來表示節(jié)點,以及用于邊緣和標(biāo)簽的任何元數(shù)據(jù)。
[('0x2fdcca65899346af3a93a8daa6128bdbcb1ce3b3',
'0xcedf17dfafa947cd0e205fe2a3a183cf2fb3a0bc',
{'transaction_hash': '0xb235f0321b0b50198399ec7f2bb759ef625f85673b4d90d68f711229750181e4',
'block_number': '14675897',
'date': '2022-04-28',
'asset_id': '7438',
'sale_price_eth': 153.2,
'sale_price_usd': 442685.5285671361,
'transaction_type': 'sell',
'asset_contract': '0xbc4ca0eda7647a8ab7c2061c2e118a18a936f13d'}),
('0x2fdcca65899346af3a93a8daa6128bdbcb1ce3b3',
'0xd8fdd6031fa27194f93e1a877f8bf5bfc9b47e1e', {'transaction_hash':'0x7b4797061eb16d73a28a869e51745e471e2849a55c80459b2aff7f0205925d74',
'block_number': '14654313',
'date': '2022-04-25',
'asset_id': '5954',
'sale_price_eth': 0.0,
'sale_price_usd': 0.0,
'transaction_type': 'transfer',
'asset_contract': '0xbc4ca0eda7647a8ab7c2061c2e118a18a936f13d'})]
根據(jù)這些準(zhǔn)備好的數(shù)據(jù), NetworkX 軟件包使可視化網(wǎng)絡(luò)圖與nx.draw一樣簡單,但在數(shù)據(jù)幀中有超過 4 萬個事務(wù),可視化整個圖只會返回一個無用的 blob 。因此,您必須明確在您的事務(wù)中可視化什么,以創(chuàng)建一個引人入勝的數(shù)據(jù)故事。
可視化潛在的清洗交易
您可以驗證市場上其他人的陳述,而不是瀏覽 10000 筆非金融交易。值得注意的是 NFT Wash Trading – Is it possible to protect against it? 《華盛頓郵報》稱, BAYC token 8099 可能受到洗牌交易欺詐行為的影響。
如果您按照隨附筆記本中的說明進行操作,則執(zhí)行以下步驟:
僅將準(zhǔn)備好的 NFT 數(shù)據(jù)篩選到包含asset_id 8099 日志的行。
將to和from錢包地址重命名為大寫字母,按錢包地址首次出現(xiàn)在非金融資產(chǎn)交易中后的順序排列。
使用 NetworkX 包使用準(zhǔn)備好的資產(chǎn) 8099 數(shù)據(jù)生成網(wǎng)絡(luò)圖數(shù)據(jù)。
使用所需的標(biāo)簽、邊箭頭和節(jié)點定位繪制網(wǎng)絡(luò)圖。
BAYC 8099 NFT 是否經(jīng)歷過清洗交易?
圖 2 中繪制的數(shù)據(jù)使您能夠可視化與資產(chǎn) 8099 相對應(yīng)的數(shù)據(jù)H,您可以看到,這款錢包首先將價格從 9.5 萬美元提高到了 16.6 萬美元H 《 – 》 I也就是說,然后通過之間的傳輸添加更多事務(wù)H 《 – 》 J最后H向節(jié)點出售可能人為增加的 NFTK.
圖 2.在 NFT BAYC 8099 的交易之后
盡管該圖不能確定該節(jié)點的狀態(tài)H從事洗牌交易,因為你不知道是否H,我和J同一個人擁有的錢包在某個節(jié)點上出現(xiàn)循環(huán),價格上漲應(yīng)表明需要進行更多的盡職調(diào)查。例如,您可以查看 etherscan.com 要查看以下錢包之間的交易:
0xe4bc96b24e0bdf87b4b92ed39c1aef8839b090dd(節(jié)點H)。
0x7e99611cf208cb097497a59b3fb7cb4dfd115ea9(節(jié)點我)。
0xcbc9f463f83699d20dd5b54be5262be69a0aea9f(節(jié)點J)。
也許是節(jié)點H有賣家的悔恨,希望他們的非金融交易能回來,因為投資者對他們鐘愛的非金融工具產(chǎn)生依戀并不少見。但是與節(jié)點相關(guān)聯(lián)的錢包之間存在大量交易H,我和J可能指示 NFT 資產(chǎn)的進一步危險信號。
關(guān)于作者
馬克是一名社區(qū)健康倡導(dǎo)者,后來成為數(shù)據(jù)科學(xué)家,對社會影響、商業(yè)和技術(shù)的交叉點感興趣。他的人生使命是通過數(shù)據(jù)改善盡可能多的人的福祉,特別是那些邊緣化的人。
審核編輯:郭婷
-
可視化
+關(guān)注
關(guān)注
1文章
1198瀏覽量
20994 -
python
+關(guān)注
關(guān)注
56文章
4802瀏覽量
84890
發(fā)布評論請先 登錄
相關(guān)推薦
評論