在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌推出數據集搜索黑科技,再也不用發愁找數據!

ExMh_zhishexues ? 來源:未知 ? 作者:胡薇 ? 2018-09-14 14:09 ? 次閱讀

旨在整合全球互聯網信息的谷歌,其首要目標本來是林林總總的商業網站。但最近,它推出了一種新型的數據集搜索引擎,將服務目標延展到了科研社群。這就是屬于科研工作者等數據狂的黑科技——Google Dataset Search(谷歌數據集搜索)。

谷歌數據集搜索發起了一次數據搜索的革命,它讓人們能夠迅速獲取分散在全互聯網的各式數據集。無論是網站、數字圖書館還是專業數據庫,只要是存在于線上的共享數據集,就能夠被引擎找到。用戶鍵入搜索信息后,谷歌會分析比對相同數據集的不同版本,并盡可能地檢索有價值的相關信息。

實際上,這次革命的核心工具非常純粹,就是一個可以將各式數據集集中在一起加以描述檢索的開放標準(http://schema.org)。數據發布者按照這個標準所定義的標簽框架,對發布的數據內容進行標簽式的描述。定義的標簽包括發布時間、發布方、數據收集方式等等。而引擎隨后會將這些標簽信息編入索引,并與谷歌知識譜圖結合使用,從而使本來分布零散的數據集成為一個能夠統一檢索的強大系統。

Figure.1Google Dataset Search使用實例

Figure.2Google Dataset Search使用實例

谷歌的人工智能科學家娜塔莎·諾伊(Natasha Noy)接受采訪時表示,創建數據集搜索的目標是將數以萬計的在線數據集統合展示,并非自行建立數據庫收集數據,她說:“我們只是希望這些數據能夠被人們輕松獲取,并不是想將其收集挪動到其他地方。“

目前,互聯網上的數據集資料分布極其零散。不同的學科領域各自擁有自己的首選資源庫,各政府機構和地方當局更是如此。諾伊說:“科學家們當然知道能在哪些專業數據庫找到他們自己領域的數據,但他們有時想要的并不是這一類數據。而一旦他們將視野拓展到專業領域之外,數據搜尋就會變得十分困難。”

諾伊舉了一個她親歷親聞的例子,一位氣象學家在為即將開展的研究尋找海洋溫度的特定數據集,但怎么也找不到。她沒有繼續追蹤,直到她在遇到了相關方面的同事,在同事的幫助下她才找到那個數據庫。然后她的研究工作才得以繼續。諾伊說:“雖然保存數據的地方算是很顯見,數據描述也寫得很清晰,但仍然很難被找到。”

該搜索引擎的初始版本主要包括來自ProPublica等新聞機構以及政府機構的數據和數據集。 但是,如果這項搜索服務最終流行起來,那么隨著機構和科學家爭相開放數據的訪問權限,它所囊括的數據量肯定會呈現滾雪球式的成長。

而近年來,世界各地關于數據開放共享的倡議正在蓬勃發展,這將有助于數據集搜索引擎的實現。諾伊認為,在過去的幾年里,可共享數據的存量已經爆炸,她將此歸功于科學文獻中數據的重要性在日益增長——因為期刊會要求作者將數據集發布出來。而除此之外,美國政府和歐洲政府的法律法規也在進一步引導數據開放共享。

開放數據研究所(ODI)首席執行官Jeni Tennison表示,Google參與到開放數據行動中來,將更有利于這項運動獲得成功。數據集搜索一直是一個很困難的事情,希望谷歌能讓它變得更加容易。她進一步說,要創建一個像樣的搜索引擎,你需要知道如何構建對用戶友好的系統,并了解人們在鍵入某些短語時的真實所想。而谷歌對這些了如指掌。事實上,對于搜索引擎來說,最重要的是用戶所產生的行為數據,這才是促進引擎快速成長的活力源泉。所以,雖然搜索引擎賴以抓取數據集的元數據標簽是一個開放標準,任何競爭對手(如Bing或Yandex等)都可以使用它來構建自己的競爭服務,但谷歌從沒有喪失自己的真正優勢。Tennison也表示:“直觀地了解人們的搜索方式很重要,譬如,他們在檢索時會使用什么樣的術語,又會如何表述這些術語。從了解人們如何搜索數據,并據此進一步推進數據開放的角度說,如果谷歌能夠開放自己的用戶行為數據,將會大有裨益。”

總而言之,更多的數據開放共享是值得期待的潮流,而谷歌無疑又一次扛起了領頭的大旗。當然,在谷歌完全回歸中國之前,我們距離便利還會多一個梯子的距離。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6171

    瀏覽量

    105508
  • 搜索引擎
    +關注

    關注

    0

    文章

    119

    瀏覽量

    13363

原文標題:谷歌新推數據搜索,科學研究還爬樓么?

文章出處:【微信號:zhishexueshuquan,微信公眾號:知社學術圈】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    lmp91200 spi只接收數據不用返回數據嗎?

    lmp91200 spi只接收數據不用返回數據嗎?
    發表于 01-01 08:19

    LDC1614EVM在UPLOAD固件過程中意外斷開連接,然后就再也不能正常連接了,怎么處理?

    請教一下LDC1614EVM在UPLOAD固件過程中意外斷開連接,然后就再也不能正常連接了。請問應該如何處理
    發表于 12-27 06:09

    蘋果為谷歌支付數十億美元辯護,參與搜索案反壟斷審判

    近日,蘋果公司已正式要求參與谷歌即將在美國舉行的在線搜索反壟斷審判,此舉旨在為其與谷歌之間的收入分成協議進行辯護。該協議使得谷歌成為Safari瀏覽器的默認
    的頭像 發表于 12-26 10:41 ?146次閱讀

    谷歌取消“站點鏈接搜索框”,適應新搜索需求

    近日,谷歌發布了一則通知,決定取消搜索結果中的“站點鏈接搜索框”。這一功能已經陪伴了用戶十多年,它允許用戶在特定網站上進行更深入的搜索,為許多網民提供了便利。然而,隨著時代的變遷和技術
    的頭像 發表于 10-23 11:20 ?346次閱讀

    OpenAI將推出在線搜索工具“SearchGPT”

    科技巨頭OpenAI正悄然醞釀一場搜索領域的變革,其最新推出的在線搜索工具“SearchGPT”正悄然挑戰著Alphabet旗下谷歌搜索
    的頭像 發表于 07-26 16:54 ?699次閱讀

    PyTorch如何訓練自己的數據

    PyTorch是一個廣泛使用的深度學習框架,它以其靈活性、易用性和強大的動態圖特性而聞名。在訓練深度學習模型時,數據是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的數據
    的頭像 發表于 07-02 14:09 ?1786次閱讀

    請問NanoEdge AI數據該如何構建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數據的問題,請問我該怎么構建數據?或者生成模型失敗還會有哪些原因?
    發表于 05-28 07:27

    谷歌將在AI搜索中加入廣告

    谷歌近日宣布,將在美國測試在人工智能生成的答案中嵌入搜索和購物廣告。這一創新舉措緊隨其年度I/O大會上推出的人工智能概覽功能之后。
    的頭像 發表于 05-23 09:23 ?480次閱讀

    OpenAI計劃下周一宣布對標谷歌搜索的競品

    OpenAI即將在下周一揭曉一項重大創新,他們計劃推出一款全新的AI搜索產品,以挑戰當前搜索領域的巨頭谷歌。這一決定無疑將加劇雙方在搜索市場
    的頭像 發表于 05-11 09:22 ?368次閱讀

    谷歌Vertex AI搜索在醫療保健領域正式推出

    谷歌公司近日宣布,其Vertex AI搜索功能在醫療保健領域正式亮相,并已成功與MedLM以及醫療保健數據引擎(HDE)完成集成。這一創新功能專為醫護人員設計,旨在從繁雜的醫療記錄中快速且精準地提取出關鍵的臨床信息。
    的頭像 發表于 03-22 14:08 ?636次閱讀

    蘋果微軟曾洽購必應,因谷歌搜索質量未果

    CNBC及其他媒體引述的美國司法部反壟斷公訴書詳細列舉了谷歌搜索領域所持的壟斷角色。訴狀中透露,盡管微軟多次試圖將必應用戶作為Safari瀏覽器的默認搜索引擎,但每一次均因搜索結果質
    的頭像 發表于 02-25 10:39 ?707次閱讀

    谷歌搜索引擎優化的各個方面和步驟

    谷歌搜索引擎是最受歡迎和廣泛使用的搜索引擎之一,為了使你的網站在谷歌上更好地排名并提高曝光度,你可以采取一些谷歌
    的頭像 發表于 01-25 10:29 ?903次閱讀

    自動駕駛領域的數據匯總

    發自動駕駛論文哪少的了數據,今天筆者將為大家推薦一篇最新的綜述,總結了200多個自動駕駛領域的數據,大家堆工作量的時候也可以一些小眾的
    的頭像 發表于 01-19 10:48 ?1018次閱讀
    自動駕駛領域的<b class='flag-5'>數據</b><b class='flag-5'>集</b>匯總

    語音數據在智能語音搜索中的應用與挑戰

    一、引言 隨著互聯網的普及和移動設備的興起,智能語音搜索已經成為人們獲取信息的重要方式之一。智能語音搜索通過語音交互的方式,為用戶提供更加便捷、高效的信息查詢服務。語音數據在智能語音
    的頭像 發表于 01-18 15:09 ?566次閱讀

    再也不用手動關燈了,用安信可的小安派做一個智能家居中控

    本作品由安信可社區用戶 noonezero 制作 以下是我的項目之再也不用手動關燈系列,為了方便小伙伴們看效果,大家可以先點擊看視頻。 https://www.bilibili.com/video
    的頭像 發表于 01-08 17:26 ?595次閱讀
    <b class='flag-5'>再也不用</b>手動關燈了,用安信可的小安派做一個智能家居中控
    主站蜘蛛池模板: 日本在线一区| 一级黄a| 日本不卡专区| 91人成网站色www免费| 久久国产中文字幕| 一级片在线观看视频| 在线视频 亚洲| 一卡二卡卡四卡无人区中文| 国产午夜人做人视频羞羞| 日韩高清性爽一级毛片免费| avtt香蕉| 亚洲欧美网站| 真爽~张开腿~让我插| 8090yy理论三级在线观看| 日日插天天操| 五月天婷婷免费视频观看| www.色亚洲| 成人性欧美丨区二区三区 | 欧美日韩一日韩一线不卡| 婷婷六月天激情| 影音先锋ady69色资源网站| 网站在线你懂的| 欧美成人午夜不卡在线视频| 日本高清色图| 被男同桌摸内裤好爽视频| 亚洲1区2区3区4区| 污污的网站免费阅读| 中文字幕欧美日韩| 一级片免费在线| 张柏芝三级无删减在线观看| 国模极品一区二区三区| 欧美成人自拍视频| aaa在线观看| 一道精品视频一区二区三区男同| 男人资源| 日日夜夜天天操| 欧美涩区| 亚洲高清一区二区三区四区| 在线播放 你懂的| 免费一级特黄 欧美大片| 黄色三级在线看|