在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

濤思數據開源TDengine,10多萬行C代碼,登頂GitHub!

5RJg_mcuworld ? 來源:YXQ ? 2019-07-31 16:07 ? 次閱讀

7月28日周日下午,大暑剛過的北京,熱得愈加肆意。編者來到在濤思數據聯合CSDN舉辦的「TDengine 和他的小伙伴們」的Beijing Meetup現場時,陶建輝正在答觀眾問。

突然,編者被一位20來歲的小姑娘熱心提醒可以坐下聽。攀談幾句,得知姑娘是留學倫敦的電子工程畢業生,趁放暑假來這里做志愿者。

不僅志愿者很高大上,濤思數據的團隊也很“高配”:3位博士,4位海歸。他們最近斬獲超級喜訊一枚:僅有十人的濤思數據團隊,在GitHub開源的TDengine,連續數天雄踞榜首。

那么,這是怎樣的一個項目?又是怎樣的一個團隊?團隊背后的創始人有著怎樣的經歷?創始人陶建輝親自撰寫本文,為你答疑解惑,趕快往下看吧!

7月12日,濤思數據宣布將TDengine開源,10多萬行C代碼,包括最核心的存儲引擎和計算引擎都上傳到了GitHub上。

整整兩周時間,GitHub上Star已經超過7300,Fork數已經超過1800,在開發者社區中獲得的反響遠超預期。應開發者要求,7月28日在北京進行了一次線下交流,現場互動十分熱烈。

線下活動現場

很多人好奇,為什么一個從沒研發過大數據,也沒研發過數據庫軟件的人,能研發物聯網大數據平臺軟件?

而且你怎么想到要開發這樣軟件的?你三次創業,每次都在跨界,怎么能做到的?

7月28日,我把創業過程中的思考和分析分享出來,供在創業路上的朋友特別是技術型創業者參考。

2016年初,我上家創業公司快樂媽咪被收購,一下就輕松下來。但總有很多朋友拉我去看項目,有想讓我投資的,有想讓我加入團隊的。

因為我在智能硬件圈子里有一定名氣,因此看的最多的還是智能硬件、物聯網相關的項目。花了自己不少時間仔細琢磨的有好幾個項目。

第一個就是菜市場的智能秤,希望通過智能秤將菜市場的信息流完全打通,打造一個不亞于美團的平臺出來;

第二個就是養殖物聯網,希望對投料機進行自動控制,對養殖的魚塘的環境進行監測,通過物聯網將飼料、養殖、水產銷售打通,形成平臺;

第三個是電梯物聯網,系統通過監測,由按期保修變成按需保修,而且建立全國性的電梯維保平臺。

還有智能家居等好幾個,但最終沒有一個打動我,讓我投入進去。因為我分析這些項目之后,發現他們成功的關鍵因素,都不是我或者現有團隊具備的。

但這些項目讓我看到了物聯網的前景,看到萬物互聯是不可阻擋的潮流,一定要抓住。我一個強技術背景,沒有多少行業資源的人,能在這股潮流里找到什么樣的機會?

我的第一反應就是研發一個物聯網平臺,但仔細一看,從IT巨頭如微軟、IBM、 Oracle、亞馬遜,到工業巨頭如GE、Siemens等等,無不有自己的物聯網平臺,特別是仔細看完GE的Predix,發現自己能想到的東西都被它做了。

再看國內,做物聯網平臺的公司就更多了,海爾、三一、徐工、阿里、百度等等,就更不用提無數Startup了。心一下就涼了,這個物聯網平臺是絕不能做了,要做就是瞎折騰,唯一的可能性是緊靠一行業資源,靠行業特性和市場資源取勝,但我偏偏沒有多少行業背景和資源。

但在仔細看完很多物聯網平臺的資料后,終于發現了一絲曙光,那就是數據處理。物聯網平臺里模塊很多,但其中很重要的一塊就是數據處理,包括采集、存儲、查詢、分析和計算,是整個物聯網行業里面比較共性的部分,個性化程度不高。

再仔細一看,大部分物聯網平臺,尤其是國內的,幾乎無一例外的用的是Hadoop生態搭建的,用的是互聯網行業流行的大數據架構,采集進來的數據先進Kafka, 然后分流進HBase/Cassandra/MongoDB等做持久化存儲,進Redis做緩存,進Spark/Flink等做流式計算,后面再接應用、大屏展示等等。

雖然我沒有真正接觸過大數據的處理,但了解這些通用的大數據框架后,我的第一反應就是,Hadoop這套體系太重,至少對于物聯網大數據而言如此。

搭建一個平臺,居然要好多款開源軟件拼接在一起,研發、運維效率會很低,數據一致性很難保證,定位一個問題牽涉的環節太多,很不適合私有化部署。

將各種物聯網場景抽象出來,我總結出了物聯網數據的十二大特點:

  1. 數據是時序的,一定帶有時間戳;

  2. 數據是結構化的;

  3. 數據極少有更新或刪除操作;

  4. 數據源是唯一的;

  5. 相對互聯網應用,寫多讀少;

  6. 用戶關注的是一段時間的趨勢,而不是某一特點時間點的值;

  7. 數據是有保留期限的;

  8. 數據的查詢分析一定是基于時間段和地理區域的;

  9. 除存儲查詢外,還往往需要各種統計和實時計算操作;

  10. 流量平穩,可以預測;

  11. 往往需要有插值等一些特殊的計算;

  12. 數據量巨大,一天采集的數據就可以超過100億條。

總結出這些特點后,一下豁然開朗,覺得采用Hadoop這些開源軟件來處理物聯網數據完全是大錯特錯。

物聯網數據像日志數據,幾乎沒有更新操作的可能,那數據庫中的事務處理的實現就完全多余;數據是時序的,時間戳自然可以作為主鍵,根本不需要復雜的索引結構;物聯網數據是結構化的,像HBase、Cassandra那樣用Key-Value來存儲,計算效率和存儲效率大打折扣,應該采用結構化存儲才行;物聯網數據的冷熱程度是時間決定的,剛采集的數據是最熱的,而不是用戶點擊決定。

因此用簡單的先進先出的內存管理就能很好的實現高效的緩存,根本就不需要Redis;物聯網數據從一個設備來看,就是一個數據流,實現滑動窗口的流計算那不是一個最順其自然的事情,哪用得上Spark這么復雜的引擎;對于數據分區,簡單的按設備分區按時間段分區,就輕松解決,根本就不需要復雜的分區機制;物聯網數據流是相對平穩的,而且物聯網設備本身一定有緩存能力,完全可以拋棄Kafka這些套件,實現一個簡單的消息隊列和數據訂閱來滿足需求。

隨后又發現有時序數據庫,馬上看他們文檔和代碼,發現他們利用了時序數據一些特點,但還是沒有充分利用,而且只是定位為一個數據庫。

后面又了解到工業界有實時數據庫,發現這些實時數據庫都是老古董產品了,基本上都還是Windows上研發,價格貴,而且沒有標準SQL,水平擴展幾乎沒有,大數據分析能力幾乎沒有,完全沒有能力應對日益增長的大數據量和大數據分析需求,遲早會被淘汰。

我做完分析后很興奮,覺得找到了一空白點。但我自己有沒有能力研發這產品?仔細一琢磨,還是興奮。

2008年,我創辦和信,推送平臺除推送之外,一個重要的模塊就是消息隊列。2009年,我們就研發了一個分布式高可靠、持久化存儲的消息隊列,每臺手機需要推送的消息就放在一個隊列里。消息隊列與物聯網的時序數據有區別嗎?本質上沒有。

一個是非結構化的,一個是結構化的;一個是簡單的進和出,但另外一個是需要有分析和計算的;兩者在系統的架構設計上沒有大的不同。

考慮到必須設計成分布式系統,因為多年通訊設備研發背景,對我那是輕車熟路。因此,我應該具備所需要的知識儲備和技能,自己多年積累的研發經驗全部能派上用場 。

因此我迅速定位了自己要做的產品,那就是物聯網大數據平臺,要把時序數據庫、緩存、消息訂閱、流式計算等系列功能融合在一起,一站式的解決物聯網大數據問題,這樣才能將系統研發、維護的復雜度與成本大幅降低。

前面兩次創業,都是2C產品,讓我養成了追求簡單極致的習慣,馬上又定下采用SQL接口,能通過JDBC接口與眾多第三方工具無縫集成,安裝部署要一鍵搞定的策略,目的是要讓開發者用起來輕松,完全沒有學習成本。

研究物聯網數據的特點后,我想到了兩個技術創新點,一是“一臺設備一張表”的數據模型來極大提高單臺設備的數據插入和查詢效率, 二是給每張表打靜態標簽,將靜態標簽數據與采集的動態數據完全分開存儲,來解決多表聚合查詢問題。

想明白這些后,2016年底,接近50的我決定親自寫程序開干。為什么不找人呢?幾個原因:

  • 自己做技術多年,有個心結,就是希望自己寫的代碼能被無數的人使用;

  • 開發難度大,特別是分布式,如果我自己不把主要框架搭完,把存儲引擎寫好,那團隊效率會很低;

  • 這個產品的核心是技術,如果自己不重度參與研發,那公司會很危險。

我準備動手寫的時候,告訴太太,如果我寫的存儲引擎在數據插入、查詢速度上不比其他數據庫好五倍以上,就當做我又寫了一段好玩的程序。

如果能達到五倍以上,那我就要再折騰一次。因為在我的眼里,技術型的產品,要打敗市場上現有的廠商,如果沒有五倍以上的優勢,那完全沒有必要做,因為對方有人、有錢,有客戶群,你憑什么與對方開戰?

幸運的是,我2個月時間,寫完一萬八千多行代碼,完全證明憑借我的兩大創新,性能上可以秒殺市場上現有產品,因此就有了今天的TDengine。

濤思數據團隊,左三為陶建輝兒子(00后一枚),TDengine項目其亦有貢獻

研發底層基礎軟件,開發難,推廣更難。即使功能、性能比現有產品好一個數量級,客戶還是會以安全性和穩定性為由拒絕你,因此我想到應該用開源的方式,把最核心的代碼和詳細的設計都曬出來,讓更多的程序員參與進來,將開發者社區建立起來。

活躍的開發者社區能讓所有大客戶都感覺到所選的技術不會被拋棄,不會有重大安全漏洞, 可放心使用。

另外一方面,很多中小企業客戶數據量不大,技術上有很多選擇,如果不開源,他們就會選擇一些其他的開源方案。

本來就賺不到他們的錢,那為何不開源給他們,讓他們免費用呢?不僅要讓大家免費用,我們還要組織一個不小的團隊來運營,與各種背景的開發者互動,回答他們的疑問,讓他們得到技術支持和幫助,更希望他們參與進來,有榮譽感和自豪感,他們才可能發自內心地傳播。

同時,通過開源,可以快速獲得市場對產品的反饋,了解市場的需求,這是一件多好的事情,因此毫無猶豫的決定開源。

大數據平臺、物聯網平臺和數據庫都已經有很多主流產品,挑戰他們是一件困難的事情。而專為物聯網打造的大數據平臺,目前還沒有,TDengine在全球是第一家。

物聯網的市場在高速增長,采集的數據量更是指數式的上升,5年的時間,世界上90%的數據都會是物聯網類型的數據,這個細分市場一定會成為一個主流市場。

只要濤思數據團隊繼續努力,抱著開放、合作的態度,充分利用開源打造出技術生態,同時與全球的系統集成商、獨立軟件開發商、渠道等合作,積極的構建出商業生態,那TDengine一定有成為獨角獸的一天。

喜歡丘吉爾說的一句話,“Success is not final, failure is not fatal, it is the courage to continue that counts”,繼續奔跑吧,伙伴們!


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 代碼
    +關注

    關注

    30

    文章

    4788

    瀏覽量

    68617
  • GitHub
    +關注

    關注

    3

    文章

    471

    瀏覽量

    16448

原文標題:三次創業,三次跨界,這次憑十萬行核心C代碼登上 GitHub Top 1!

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    GitHub Copilot 可以免費使用了!

    用!建議大家都先去試一下,再決定要不要花每個月10美金訂閱! ? ” 不管是 Github Copilot 還是 Cursor,最大的優點是可以在 IDE 里面直接修改或審核代碼,而且可以幾個文件一起
    的頭像 發表于 12-22 11:19 ?149次閱讀
    <b class='flag-5'>GitHub</b> Copilot 可以免費使用了!

    深度解讀上海海開源鴻蒙平臺

    OpenHarmony是面向物智聯的新一代的開源操作系統,正加速成為千百業的數字底座。自OpenHarmony誕生以來,上海海始終堅定地擁抱OpenHarmony,不僅是Open
    的頭像 發表于 12-16 14:44 ?299次閱讀

    香蕉派開源社區與矽昌通信共推BPI-Wifi5 低成本路由器開源方案

    和其他網絡環境。由Banana Pi 開源硬件社區與矽昌通信聯合推出,采用開源方式運作,所有的軟件都公開在Github上,開發者與用戶可以自由編譯自己的軟件。 BPI-Wifi5 Router雙頻無線
    發表于 11-28 10:37

    GitHub Copilot引入模型支持

    近日,據外媒報道,GitHub正在為其代碼完成和編程工具Copilot引入模型支持。這一舉措將為開發者提供更加靈活和多樣化的選擇。 在近日舉辦的GitHub Universe大會上,
    的頭像 發表于 10-31 11:49 ?514次閱讀

    真格基金宣布捐贈開源AI項目vLLM

    個通用人工智能項目,Hugging Face 上有超過 40 個模型。每一周,有超過 100 萬行代碼開源 AI 領域中創建,開發者
    的頭像 發表于 09-24 16:13 ?392次閱讀

    上傳本地項目代碼github

    概述 GitHub是一個面向開源及私有軟件項目的托管平臺,因為只支持git 作為唯一的版本庫格式進行托管,故名GitHub。本文主要講解如何將本地代碼上傳至
    發表于 09-11 16:33

    GitHub推出GitHub Models服務,賦能開發者智能選擇AI模型

    8月2日,全球領先的代碼托管平臺GitHub宣布了一項重大創新——GitHub Models服務的正式推出。該服務被定位為AI時代的工程師助手,旨在幫助全球超過1億的GitHub用戶輕
    的頭像 發表于 08-02 15:39 ?589次閱讀

    快訊 | 發展新質生產力問道賽?賽如何下好“創新棋”?

    7月11日,南湖區委宣傳部、清華大學馬克主義學院共同帶隊一蒞臨賽圍繞時頻新質生產力創新層面進行實地調研,賽副總經理田永和、對外合作部部長葉泂
    的頭像 發表于 07-12 13:31 ?502次閱讀
    賽<b class='flag-5'>思</b>快訊 | 發展新質生產力問道賽<b class='flag-5'>思</b>?賽<b class='flag-5'>思</b>如何下好“創新棋”?

    400!深開鴻OpenHarmony主倉代碼貢獻量再創里程碑!

    2024年7月8日,據OpenAtomOpenHarmony(以下簡稱“OpenHarmony”)官網顯示,深開鴻在OpenHarmony社區主倉代碼貢獻總量超過400萬行,在華為以外的生態廠商中
    的頭像 發表于 07-09 08:33 ?358次閱讀
    400<b class='flag-5'>萬</b>!深開鴻OpenHarmony主倉<b class='flag-5'>代碼</b>貢獻量再創里程碑!

    快訊 | 熱烈歡迎嘉興市政協一領導蒞臨賽總部調研指導工作!

    近日,嘉興市政協一領導蒞臨賽總部調研指導工作,賽副總經理王文、田永和全程陪同。嘉興市政協一領導蒞臨賽
    的頭像 發表于 05-17 13:22 ?527次閱讀
    賽<b class='flag-5'>思</b>快訊 | 熱烈歡迎嘉興市政協一<b class='flag-5'>行</b>領導蒞臨賽<b class='flag-5'>思</b>總部調研指導工作!

    GitHub推出新功能:智能掃描代碼潛在漏洞

    代碼掃描”功能還能預防新手引入新的問題,并支持在設定的日期和時間進行掃描,或者讓特定事件(如推送到倉庫中)觸發掃描。若AI判定代碼內可能存在隱患,GitHub將在倉庫中發出預警,待用戶修正引發求救信號的部分后,再撤銷警告。
    的頭像 發表于 03-21 14:55 ?708次閱讀

    MySQL單表數據量限制:為何2000萬行成為瓶頸?

    很多人認為:數據量超過500萬行或2000萬行時,引起B+tree的高度增加,延長了索引的搜索路徑,進而導致了性能下降。事實果真如此嗎?
    的頭像 發表于 02-27 10:38 ?6229次閱讀
    MySQL單表<b class='flag-5'>數據</b>量限制:為何2000<b class='flag-5'>萬行</b>成為瓶頸?

    [開源]界星空開源MES系統,支持低代碼大屏設計

    界星空科技免費MES、開源MES、商業開源MES、商業開源代碼MES、市面上最好的開源MES
    的頭像 發表于 01-12 13:43 ?788次閱讀
    [<b class='flag-5'>開源</b>]<b class='flag-5'>萬</b>界星空<b class='flag-5'>開源</b>MES系統,支持低<b class='flag-5'>代碼</b>大屏設計

    OpenHarmony社區運營報告(2023年12月)

    。 ? 2023 年 12 月新增 19 款產品通過兼容性測評,累計 467 款產品通過兼容性測評。 一、代碼貢獻 1、2023 年度,累計新增 1615 萬行代碼;華為貢獻 89%,余下貢獻者共建 132 個
    發表于 01-10 15:44

    百度發布Apollo開放平臺9.0

    在2023年的12月19日,百度正式發布了Apollo開放平臺的全新版本——Apollo開放平臺9.0。這一版本的推出,源于團隊在8.0至9.0的開發過程中,對12萬行代碼進行了重構,并新增了20萬行
    的頭像 發表于 01-02 16:18 ?1202次閱讀
    主站蜘蛛池模板: 中国videos偷窥| 亚洲特级毛片| 香蕉成人国产精品免费看网站 | 精品国产柚木在线观看| 狠狠色色综合网站| 欧美线人一区二区三区| 久久综合九色婷婷97| 国产毛片农村妇女系列| 超色视频| 手机看片日韩在线| v视界影院最新地址| 制服丝袜国产精品| 在线观看你懂的视频| 久色99| 久久免| xxxx日本xx| 中文字幕人成不卡一区| 天堂免费视频| 猛操女人| 新天堂网| 国产98在线传媒在线视频| 亚洲一区有码| 四虎永久网址影院| 激情五月婷婷色| 天天激情综合| 日本高清在线3344www| 狠狠色噜噜狠狠狠狠五月婷| 老外一级黄色片| 久久狠狠第一麻豆婷婷天天| 无人码一区二区三区视频| 欧美色天使| 黄网在线观看免费| 乱高h亲女| 日本黄色视屏| 2021日本三级理论影院| 国产精品天天在线| 在线久综合色手机在线播放| 国产二区三区| 波多野结衣福利| 亚洲精品福利网站| 免费爱爱视频|