91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出數(shù)據(jù)集搜索黑科技,再也不用發(fā)愁找數(shù)據(jù)!

ExMh_zhishexues ? 來源:未知 ? 作者:胡薇 ? 2018-09-14 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

旨在整合全球互聯(lián)網(wǎng)信息的谷歌,其首要目標本來是林林總總的商業(yè)網(wǎng)站。但最近,它推出了一種新型的數(shù)據(jù)集搜索引擎,將服務(wù)目標延展到了科研社群。這就是屬于科研工作者等數(shù)據(jù)狂的黑科技——Google Dataset Search(谷歌數(shù)據(jù)集搜索)。

谷歌數(shù)據(jù)集搜索發(fā)起了一次數(shù)據(jù)搜索的革命,它讓人們能夠迅速獲取分散在全互聯(lián)網(wǎng)的各式數(shù)據(jù)集。無論是網(wǎng)站、數(shù)字圖書館還是專業(yè)數(shù)據(jù)庫,只要是存在于線上的共享數(shù)據(jù)集,就能夠被引擎找到。用戶鍵入搜索信息后,谷歌會分析比對相同數(shù)據(jù)集的不同版本,并盡可能地檢索有價值的相關(guān)信息。

實際上,這次革命的核心工具非常純粹,就是一個可以將各式數(shù)據(jù)集集中在一起加以描述檢索的開放標準(http://schema.org)。數(shù)據(jù)發(fā)布者按照這個標準所定義的標簽框架,對發(fā)布的數(shù)據(jù)內(nèi)容進行標簽式的描述。定義的標簽包括發(fā)布時間、發(fā)布方、數(shù)據(jù)收集方式等等。而引擎隨后會將這些標簽信息編入索引,并與谷歌知識譜圖結(jié)合使用,從而使本來分布零散的數(shù)據(jù)集成為一個能夠統(tǒng)一檢索的強大系統(tǒng)。

Figure.1Google Dataset Search使用實例

Figure.2Google Dataset Search使用實例

谷歌的人工智能科學家娜塔莎·諾伊(Natasha Noy)接受采訪時表示,創(chuàng)建數(shù)據(jù)集搜索的目標是將數(shù)以萬計的在線數(shù)據(jù)集統(tǒng)合展示,并非自行建立數(shù)據(jù)庫收集數(shù)據(jù),她說:“我們只是希望這些數(shù)據(jù)能夠被人們輕松獲取,并不是想將其收集挪動到其他地方。“

目前,互聯(lián)網(wǎng)上的數(shù)據(jù)集資料分布極其零散。不同的學科領(lǐng)域各自擁有自己的首選資源庫,各政府機構(gòu)和地方當局更是如此。諾伊說:“科學家們當然知道能在哪些專業(yè)數(shù)據(jù)庫找到他們自己領(lǐng)域的數(shù)據(jù),但他們有時想要的并不是這一類數(shù)據(jù)。而一旦他們將視野拓展到專業(yè)領(lǐng)域之外,數(shù)據(jù)搜尋就會變得十分困難?!?/p>

諾伊舉了一個她親歷親聞的例子,一位氣象學家在為即將開展的研究尋找海洋溫度的特定數(shù)據(jù)集,但怎么也找不到。她沒有繼續(xù)追蹤,直到她在遇到了相關(guān)方面的同事,在同事的幫助下她才找到那個數(shù)據(jù)庫。然后她的研究工作才得以繼續(xù)。諾伊說:“雖然保存數(shù)據(jù)的地方算是很顯見,數(shù)據(jù)描述也寫得很清晰,但仍然很難被找到?!?/p>

該搜索引擎的初始版本主要包括來自ProPublica等新聞機構(gòu)以及政府機構(gòu)的數(shù)據(jù)和數(shù)據(jù)集。 但是,如果這項搜索服務(wù)最終流行起來,那么隨著機構(gòu)和科學家爭相開放數(shù)據(jù)的訪問權(quán)限,它所囊括的數(shù)據(jù)量肯定會呈現(xiàn)滾雪球式的成長。

而近年來,世界各地關(guān)于數(shù)據(jù)開放共享的倡議正在蓬勃發(fā)展,這將有助于數(shù)據(jù)集搜索引擎的實現(xiàn)。諾伊認為,在過去的幾年里,可共享數(shù)據(jù)的存量已經(jīng)爆炸,她將此歸功于科學文獻中數(shù)據(jù)的重要性在日益增長——因為期刊會要求作者將數(shù)據(jù)集發(fā)布出來。而除此之外,美國政府和歐洲政府的法律法規(guī)也在進一步引導數(shù)據(jù)開放共享。

開放數(shù)據(jù)研究所(ODI)首席執(zhí)行官Jeni Tennison表示,Google參與到開放數(shù)據(jù)行動中來,將更有利于這項運動獲得成功。數(shù)據(jù)集搜索一直是一個很困難的事情,希望谷歌能讓它變得更加容易。她進一步說,要創(chuàng)建一個像樣的搜索引擎,你需要知道如何構(gòu)建對用戶友好的系統(tǒng),并了解人們在鍵入某些短語時的真實所想。而谷歌對這些了如指掌。事實上,對于搜索引擎來說,最重要的是用戶所產(chǎn)生的行為數(shù)據(jù),這才是促進引擎快速成長的活力源泉。所以,雖然搜索引擎賴以抓取數(shù)據(jù)集的元數(shù)據(jù)標簽是一個開放標準,任何競爭對手(如Bing或Yandex等)都可以使用它來構(gòu)建自己的競爭服務(wù),但谷歌從沒有喪失自己的真正優(yōu)勢。Tennison也表示:“直觀地了解人們的搜索方式很重要,譬如,他們在檢索時會使用什么樣的術(shù)語,又會如何表述這些術(shù)語。從了解人們?nèi)绾嗡阉鲾?shù)據(jù),并據(jù)此進一步推進數(shù)據(jù)開放的角度說,如果谷歌能夠開放自己的用戶行為數(shù)據(jù),將會大有裨益。”

總而言之,更多的數(shù)據(jù)開放共享是值得期待的潮流,而谷歌無疑又一次扛起了領(lǐng)頭的大旗。當然,在谷歌完全回歸中國之前,我們距離便利還會多一個梯子的距離。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111407
  • 搜索引擎
    +關(guān)注

    關(guān)注

    0

    文章

    120

    瀏覽量

    13851

原文標題:谷歌新推數(shù)據(jù)搜索,科學研究還爬樓么?

文章出處:【微信號:zhishexueshuquan,微信公眾號:知社學術(shù)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    不用原廠也能做門禁卡嗎?

    不用原廠也能做門禁卡嗎?能。通過選擇通用協(xié)議門禁卡(如M1卡、CPU卡)并匹配門禁系統(tǒng)參數(shù),無需依賴原廠即可定制。廣州杰眾智能科技有限公司提供符合國際標準的門禁卡定制服務(wù),支持跨品牌適配,幫助用戶
    的頭像 發(fā)表于 02-28 14:20 ?102次閱讀
    <b class='flag-5'>不用</b><b class='flag-5'>找</b>原廠也能做門禁卡嗎?

    ???????使用 DMM Web API 獲取搜索列表數(shù)據(jù)

    ? ?DMM 平臺提供了豐富的 Web API 接口,允許開發(fā)者獲取其平臺上的各種數(shù)據(jù)。其中一個常用的接口是用于獲取搜索列表結(jié)果的 API。本文將介紹如何調(diào)用此 API 來獲取商品或內(nèi)容的列表信息
    的頭像 發(fā)表于 02-09 15:34 ?161次閱讀
    ???????使用 DMM Web API 獲取<b class='flag-5'>搜索</b>列表<b class='flag-5'>數(shù)據(jù)</b>

    Linux新手必看!3個命令搞定所有“求助”,再也不用到處查文檔

    其實根本不用慌——Linux 早就自帶了 “說明書”,學會 3 個核心幫助命令,就能解決 90% 的操作疑問,比百度還快!
    的頭像 發(fā)表于 02-03 15:28 ?707次閱讀
    Linux新手必看!3個命令搞定所有“求助”,<b class='flag-5'>再也不用</b>到處查文檔

    如何通過API獲取貝殼房二手房詳情數(shù)據(jù)

    ? ?在房產(chǎn)數(shù)據(jù)應(yīng)用開發(fā)中,獲取精準的房源信息是關(guān)鍵。貝殼房作為國內(nèi)領(lǐng)先的房產(chǎn)平臺,其數(shù)據(jù)接口為開發(fā)者提供了豐富的房源詳情信息。本文將從技術(shù)角度分析如何調(diào)用貝殼房的二手房詳情API
    的頭像 發(fā)表于 01-28 17:09 ?267次閱讀
    如何通過API獲取貝殼<b class='flag-5'>找</b>房二手房詳情<b class='flag-5'>數(shù)據(jù)</b>

    惠海H6843落地扇3V升12V1.5A降壓穩(wěn)壓芯片IC方案

    H6843 高性能升壓恒壓驅(qū)動芯片來報到!從 2.7V 到 25V 寬電壓覆蓋,連 2.5V 低電壓都能輕松啟動,鋰電池、適配器等多種供電場景全兼容,再也不用為電源匹配發(fā)愁~ 它的 \"智能功耗
    發(fā)表于 12-04 09:46

    深度解析淘寶拍立淘按圖搜索API接口與JSON數(shù)據(jù)示例參考

    引言 淘寶拍立淘是淘寶推出的一項基于圖像識別的搜索功能,用戶可以通過上傳圖片來搜索相似商品。淘寶開放平臺提供了拍立淘按圖搜索API接口,幫助開發(fā)者實現(xiàn)圖像
    的頭像 發(fā)表于 11-06 13:43 ?309次閱讀

    AI Cube如何導入數(shù)據(jù)?

    我從在線平臺標注完并且下載了數(shù)據(jù),也按照ai cube的要求修改了文件夾名稱,但是導入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發(fā)表于 08-11 08:12

    請問AICube所需的目標檢測數(shù)據(jù)標注可以使用什么工具?

    請問AICube所需的目標檢測數(shù)據(jù)標注可以使用什么工具? 我使用labelimg進行標注,標注后的數(shù)據(jù)改好文件名后導入不進去。一直卡在數(shù)據(jù)
    發(fā)表于 08-11 08:07

    云訓練平臺數(shù)據(jù)過大無法下載數(shù)據(jù)至本地怎么解決?

    起因是現(xiàn)在平臺限制了圖片數(shù)量,想要本地訓練下載數(shù)據(jù)時發(fā)現(xiàn)只會跳出網(wǎng)絡(luò)異常的錯誤,請問這有什么解決辦法?
    發(fā)表于 07-22 06:03

    使用AICube導入數(shù)據(jù)點創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯誤日志** 但是使用示例的數(shù)據(jù)可以完成訓練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓練報錯網(wǎng)絡(luò)錯誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    不用編程不用聯(lián)網(wǎng),PLC和儀表直接對SQL接數(shù)據(jù)庫,有異常時還可先將數(shù)據(jù)緩存

    不用PLC編程也不用聯(lián)網(wǎng),還不用電腦,采用IGT-DSER智能網(wǎng)關(guān)實現(xiàn)PLC和儀表直接對SQL接數(shù)據(jù)庫。 跟服務(wù)端通訊有異常時還可以先將數(shù)據(jù)
    發(fā)表于 04-12 10:47

    NVIDIA推出開源物理AI數(shù)據(jù)

    標準化合成數(shù)據(jù)的初始版本預計將成為世界上最大的此類數(shù)據(jù),目前已作為開源版本提供給機器人開發(fā)人員。
    的頭像 發(fā)表于 03-24 17:52 ?1038次閱讀

    請問NanoEdge AI數(shù)據(jù)該如何構(gòu)建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請問我該怎么構(gòu)建數(shù)據(jù)?或者生成模型失敗還會有哪些原因?
    發(fā)表于 03-10 08:20