自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

這是一份非常全面的開源數(shù)據(jù)集,你,真的不想要嗎?

開發(fā) 開發(fā)工具
近期,skymind.ai 發(fā)布了一份非常全面的開源數(shù)據(jù)集。內(nèi)容包括生物識(shí)別、自然圖像以及深度學(xué)習(xí)圖像等數(shù)據(jù)集,現(xiàn)將其整理如下。

近期,skymind.ai 發(fā)布了一份非常全面的開源數(shù)據(jù)集。內(nèi)容包括生物識(shí)別、自然圖像以及深度學(xué)習(xí)圖像等數(shù)據(jù)集,現(xiàn)將其整理如下:(內(nèi)附鏈接哦~)

[[242661]]

最近新增數(shù)據(jù)集

  • 開源生物識(shí)別數(shù)據(jù):http://openbiometrics.org/
  • Google Audioset:擴(kuò)展了 632 個(gè)音頻分類樣本,并從 YouTube 視頻中提取了 2,084,320 個(gè)人類標(biāo)記的 10 秒聲音片段。
  • 地址:https://research.google.com/audioset/
  • Uber 2B trip data:首次展示 2 百萬(wàn)公里的出行數(shù)據(jù)。
  • 地址:https://movement.uber.com/cities
  • Yelp Open Dataset:Yelp 數(shù)據(jù)集是用于 NLP 的 Yelp 業(yè)務(wù)、評(píng)論和用戶數(shù)據(jù)的子集。
  • 地址:https://www.yelp.com/dataset
  • Core50:用于連續(xù)目標(biāo)識(shí)別的新數(shù)據(jù)集和基準(zhǔn)。
  • 地址:https://vlomonaco.github.io/core50/
  • Kaggle 數(shù)據(jù)集:https://www.kaggle.com/datasets
  • Data Portal:http://dataportals.org/
  • Open Data Monitor:https://opendatamonitor.eu/
  • Quandl Data Portal:https://www.quandl.com/
  • Mut1ny 頭部/面部分割數(shù)據(jù)集:http://www.mut1ny.com/face-headsegmentation-dataset
  • Github 上的優(yōu)秀公共數(shù)據(jù)集:https://www.kdnuggets.com/2015/04/awesome-public-datasets-github.html
  • 頭部 CT 掃描數(shù)據(jù)集:491 次掃描的 CQ500 數(shù)據(jù)集。
  • 地址:http://headctstudy.qure.ai/

自然圖像數(shù)據(jù)集

  • MNIST:手寫數(shù)字圖像。最常用的可用性檢查。格式 25x25、居中、黑白手寫數(shù)字。這是一項(xiàng)簡(jiǎn)單的任務(wù)——僅某部分適用于 MNIST,不意味著它有效。
  • 地址:http://yann.lecun.com/exdb/mnist/
  • CIFAR10 / CIFAR100:32x32 彩色圖像,10/100 類。雖然仍有趣卻不再常用的可用性檢查。
  • 地址:http://www.cs.utoronto.ca/~kriz/cifar.html
  • Caltech 101:101 類物體的圖片。
  • 地址:http://www.vision.caltech.edu/Image_Datasets/Caltech101/
  • Caltech 256:256 類物體的圖片。
  • 地址:http://www.vision.caltech.edu/Image_Datasets/Caltech256/
  • STL-10 數(shù)據(jù)集:用于開發(fā)無(wú)監(jiān)督特征學(xué)習(xí)、深度學(xué)習(xí)、自學(xué)習(xí)算法的圖像識(shí)別數(shù)據(jù)集。像修改過(guò)的 CIFAR-10。
  • 地址:http://cs.stanford.edu/~acoates/stl10/
  • The Street View House Numbers (SVHN):Google 街景中的門牌號(hào)碼。可以把它想象成復(fù)現(xiàn)的戶外 MNIST。
  • 地址:http://ufldl.stanford.edu/housenumbers/
  • NORB:玩具擺件在各種照明和姿勢(shì)下的雙目圖像。
  • 地址:http://www.cs.nyu.edu/~ylclab/data/norb-v1.0/
  • Pascal VOC:通用圖像分割/分類——對(duì)于構(gòu)建真實(shí)世界圖像注釋不是非常有用,但對(duì)基線很有用。
  • 地址:http://pascallin.ecs.soton.ac.uk/challenges/VOC/
  • Labelme:帶注釋圖像的大型數(shù)據(jù)集。
  • 地址:http://labelme.csail.mit.edu/Release3.0/browserTools/php/dataset.php
  • ImageNet:新算法的客觀圖像數(shù)據(jù)集(de-facto image dataset)。許多圖像 API 公司都有來(lái)自其 REST 接口的標(biāo)簽,這些標(biāo)簽近 1000 類;WordNet; ImageNet 的層次結(jié)構(gòu)。
  • 地址:http://image-net.org/
  • LSUN:具有很多輔助任務(wù)的場(chǎng)景理解(房間布局估計(jì),顯著性預(yù)測(cè)(saliency prediction)等),有關(guān)聯(lián)競(jìng)賽。(associated competition)。
  • 地址:http://lsun.cs.princeton.edu/2016/
  • MS COCO:通用圖像理解/說(shuō)明,有關(guān)聯(lián)競(jìng)賽。
  • 地址:http://mscoco.org/
  • COIL 20:不同物體在 360 度旋轉(zhuǎn)中以每個(gè)角度成像。
  • 地址:http://www.cs.columbia.edu/CAVE/software/softlib/coil-20.php
  • COIL100:不同物體在 360 度旋轉(zhuǎn)中以每個(gè)角度成像。
  • 地址:http://www1.cs.columbia.edu/CAVE/software/softlib/coil-100.php
  • Google 開源圖像:有 900 萬(wàn)張圖像的網(wǎng)址集合,這些圖像通過(guò)知識(shí)共享(Creative Commons)被標(biāo)注成 6000 多個(gè)類別。
  • 地址:https://research.googleblog.com/2016/09/introducing-open-images-dataset.html

地理空間數(shù)據(jù)

  • OpenStreetMap:免費(fèi)提供整個(gè)星球的矢量數(shù)據(jù)。它包含(舊版)美國(guó)人口普查局的數(shù)據(jù)。
  • 地址:http://wiki.openstreetmap.org/wiki/Planet.osm
  • Landsat8:整個(gè)地球表面的衛(wèi)星視角圖,每隔幾周更新一次。
  • 地址:https://landsat.usgs.gov/landsat-8
  • NEXRAD:美國(guó)大氣層的多普勒雷達(dá)掃描圖。
  • 地址: https://www.ncdc.noaa.gov/data-access/radar-data/nexrad

————————我是深度學(xué)習(xí)圖像的分割線————————

人工數(shù)據(jù)集

  • Arcade Universe:一個(gè)人工數(shù)據(jù)集生成器,圖像包含街機(jī)游戲 sprite,如 tetris pentomino / tetromino。該生成器基于 O. Breleux 的 bugland 數(shù)據(jù)集生成器。
  • 地址:https://github.com/caglar/Arcade-Universe
  • 以 Baby AI School 為靈感的數(shù)據(jù)集集合。
  • 地址:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/BabyAISchool
  • Baby AI Shapes Dataset:區(qū)分 3 種簡(jiǎn)單形狀。
  • 地址:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/BabyAIShapesDatasets
  • Baby AI Image And Question Dataset:一個(gè)問(wèn)題-圖像-答案數(shù)據(jù)集。
  • 地址:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/BabyAIImageAndQuestionDatasets
  • Deep Vs Shallow Comparison ICML2007:為實(shí)證評(píng)估深層架構(gòu)而生成的數(shù)據(jù)集。
  • 地址:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/DeepVsShallowComparisonICML2007
  • MnistVariations:在 MNIST 中引入受控變化。
  • 地址:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/MnistVariations
  • RectanglesData:區(qū)分寬矩形和垂直矩形。
  • 地址:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/RectanglesData
  • ConvexNonConvex:區(qū)分凸形和非凸形狀。
  • 地址:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/ConvexNonConvex
  • BackgroundCorrelation:嘈雜 MNIST 背景下相關(guān)度的控制
  • 地址:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/BackgroundCorrelation

人臉數(shù)據(jù)集

  • Labelled Faces in the Wild:13000 個(gè)經(jīng)過(guò)裁剪的人臉區(qū)域(使用已經(jīng)用名稱標(biāo)識(shí)符標(biāo)記過(guò)的 Viola-Jones)。數(shù)據(jù)集中每個(gè)人員的子集里包含兩個(gè)圖像——人們常用此數(shù)據(jù)集訓(xùn)練面部匹配系統(tǒng)。
  • 地址:http://vis-www.cs.umass.edu/lfw/
  • UMD Faces:有 8501 個(gè)主題的 367,920 個(gè)面孔的帶注釋數(shù)據(jù)集。
  • 地址:http://www.umdfaces.io/
  • CASIA WebFace:超過(guò) 10,575 個(gè)人經(jīng)面部檢測(cè)的 453,453 張圖像的面部數(shù)據(jù)集。需要一些質(zhì)量過(guò)濾。
  • 地址:http://www.cbsr.ia.ac.cn/english/CASIA-WebFace-Database.html
  • MS-Celeb-1M:100 萬(wàn)張全世界的名人圖片。需要一些過(guò)濾才能在深層網(wǎng)絡(luò)上獲得最佳結(jié)果。
  • 地址:https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/
  • Olivetti:一些人類的不同圖像。
  • 地址:http://www.cs.nyu.edu/~roweis/data.html
  • Multi-Pie:The CMU Multi-PIE Face 數(shù)據(jù)庫(kù)。
  • 地址:http://www.multipie.org/
  • Face-in-Action:http://www.flintbox.com/public/project/5486/
  • JACFEE:日本和白種人面部情緒表達(dá)的圖像。
  • 地址:http://www.humintell.com/jacfee/
  • FERET:面部識(shí)別技術(shù)數(shù)據(jù)庫(kù)。
  • 地址:http://www.itl.nist.gov/iad/humanid/feret/feret_master.html
  • mmifacedb:MMI 面部表情數(shù)據(jù)庫(kù)。
  • 地址:http://www.mmifacedb.com/
  • IndianFaceDatabase:http://vis-www.cs.umass.edu/~vidit/IndianFaceDatabase/
  • 耶魯人臉數(shù)據(jù)庫(kù):http://vision.ucsd.edu/content/yale-face-database
  • 耶魯人臉數(shù)據(jù)庫(kù) B:http://vision.ucsd.edu/~leekc/ExtYaleDatabase/ExtYaleB.html
  • Mut1ny 頭部/面部分割數(shù)據(jù)集:像素超過(guò) 16K 的面部/頭部分割圖像
  • 地址:http://www.mut1ny.com/face-headsegmentation-dataset

————————我是深度學(xué)習(xí)視頻的分割線————————

視頻數(shù)據(jù)集

  • Youtube-8M:用于視頻理解研究的大型多樣化標(biāo)記視頻數(shù)據(jù)集。
  • 地址:https://research.googleblog.com/2016/09/announcing-youtube-8m-large-and-diverse.html

文本數(shù)據(jù)集

  • 20 newsgroups:分類任務(wù),將出現(xiàn)的單詞映射到新聞組 ID。用于文本分類的經(jīng)典數(shù)據(jù)集之一,通常可用作純分類的基準(zhǔn)或任何 IR /索引算法的驗(yàn)證。
  • 地址:http://qwone.com/~jason/20Newsgroups/
  • 路透社新聞數(shù)據(jù)集:(較舊)純粹基于分類的數(shù)據(jù)集,包含來(lái)自新聞專線的文本。常用于教程。
  • 地址:https://archive.ics.uci.edu/ml/datasets/Reuters-21578+Text+Categorization+Collection
  • 賓州樹庫(kù):用于下一個(gè)單詞或字符預(yù)測(cè)。
  • 地址:http://www.cis.upenn.edu/~treebank/
  • UCI‘s Spambase:來(lái)自著名的 UCI 機(jī)器學(xué)習(xí)庫(kù)的(舊版)經(jīng)典垃圾郵件數(shù)據(jù)集。根據(jù)數(shù)據(jù)集的組織細(xì)節(jié),可以將它作為學(xué)習(xí)私人垃圾郵件過(guò)濾的基線。
  • 地址:https://archive.ics.uci.edu/ml/datasets/Spambase
  • Broadcast News:大型文本數(shù)據(jù)集,通常用于下一個(gè)單詞預(yù)測(cè)。
  • 地址:http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC97S44
  • 文本分類數(shù)據(jù)集:來(lái)自 Zhang et al., 2015。用于文本分類的八個(gè)數(shù)據(jù)集合集。這些是用于新文本分類基線的基準(zhǔn)。樣本大小從 120K 至 3.6M 不等,范圍從二進(jìn)制到 14 個(gè)分類問(wèn)題。數(shù)據(jù)集來(lái)自 DBPedia、亞馬遜、Yelp、Yahoo!和 AG。
  • 地址:https://drive.google.com/drive/u/0/folders/0Bz8a_Dbh9Qhbfll6bVpmNUtUcFdjYmF2SEpmZUZUcVNiMUw1TWN6RDV3a0JHT3kxLVhVR2M
  • WikiText:來(lái)自維基百科高質(zhì)量文章的大型語(yǔ)言建模語(yǔ)料庫(kù),由 Salesforce MetaMind 策劃。
  • 地址:http://metamind.io/research/the-wikitext-long-term-dependency-language-modeling-dataset/
  • SQuAD:斯坦福問(wèn)答數(shù)據(jù)集——應(yīng)用廣泛的問(wèn)答和閱讀理解數(shù)據(jù)集,其中每個(gè)問(wèn)題的答案都以文本形式呈現(xiàn)。
  • 地址:https://rajpurkar.github.io/SQuAD-explorer/
  • Billion Words 數(shù)據(jù)集:一種大型通用語(yǔ)言建模數(shù)據(jù)集。通常用于訓(xùn)練分布式單詞表征,如 word2vec。
  • 地址:http://www.statmt.org/lm-benchmark/
  • Common Crawl:網(wǎng)絡(luò)的字節(jié)級(jí)抓取——最常用于學(xué)習(xí)單詞嵌入??蓮?Amazon S3 上免費(fèi)獲取。也可以用作網(wǎng)絡(luò)數(shù)據(jù)集,因?yàn)樗稍谌f(wàn)維網(wǎng)進(jìn)行抓取。
  • 地址:http://commoncrawl.org/the-data/
  • Google Books Ngrams:來(lái)自 Google book 的連續(xù)字符。當(dāng)單詞首次被廣泛使用時(shí),提供一種簡(jiǎn)單的方法來(lái)探索。
  • 地址:https://aws.amazon.com/datasets/google-books-ngrams/
  • Yelp 開源數(shù)據(jù)集:Yelp 數(shù)據(jù)集是用于 NLP 的 Yelp 業(yè)務(wù)、評(píng)論和用戶數(shù)據(jù)的子集。
  • 地址:https://www.yelp.com/dataset

————————我是深度學(xué)習(xí)文本的分割線————————

問(wèn)答數(shù)據(jù)集

  • Maluuba News QA 數(shù)據(jù)集:CNN 新聞文章中的 12 萬(wàn)個(gè)問(wèn)答對(duì)。
  • 地址:https://datasets.maluuba.com/NewsQA
  • Quora 問(wèn)答對(duì):Quora 發(fā)布的第一個(gè)數(shù)據(jù)集,包含重復(fù)/語(yǔ)義相似性標(biāo)簽。
  • 地址:https://data.quora.com/First-Quora-Dataset-Release-Question-Pairs
  • CMU Q / A 數(shù)據(jù)集:手動(dòng)生成的仿真問(wèn)/答對(duì),維基百科文章對(duì)其難度評(píng)分很高。
  • 地址:http://www.cs.cmu.edu/~ark/QA-data/
  • Maluuba 面向目標(biāo)的對(duì)話:程序性對(duì)話數(shù)據(jù)集,對(duì)話旨在完成任務(wù)或做出決定。常用于聊天機(jī)器人。
  • 地址:https://datasets.maluuba.com/Frames
  • bAbi:來(lái)自 Facebook AI Research(FAIR)的綜合閱讀理解和問(wèn)答數(shù)據(jù)集。
  • 地址:https://research.fb.com/projects/babi/
  • The Children’s Book Test:Project Gutenberg 提供的兒童圖書中提取的(問(wèn)題+背景、答案)對(duì)的基線。用于問(wèn)答(閱讀理解)和仿真查找。
  • 地址:http://www.thespermwhale.com/jaseweston/babi/CBTest.tgz

情感數(shù)據(jù)集

  • 多領(lǐng)域情緒分析數(shù)據(jù)集:較舊的學(xué)術(shù)數(shù)據(jù)集。
  • 地址:http://www.cs.jhu.edu/~mdredze/datasets/sentiment/
  • IMDB:用于二元情感分類的較舊、較小數(shù)據(jù)集。對(duì)文獻(xiàn)中的基準(zhǔn)測(cè)試無(wú)法支持更大的數(shù)據(jù)集。
  • 地址:http://ai.stanford.edu/~amaas/data/sentiment/
  • Stanford Sentiment Treebank:標(biāo)準(zhǔn)情感數(shù)據(jù)集,在每個(gè)句子解析樹的每個(gè)節(jié)點(diǎn)都有細(xì)粒度的情感注釋。
  • 地址:http://nlp.stanford.edu/sentiment/code.html

推薦和排名系統(tǒng)

  • Movielens:來(lái)自 Movielens 網(wǎng)站的電影評(píng)分?jǐn)?shù)據(jù)集,各類大小都有。
  • 地址:https://grouplens.org/datasets/movielens/
  • Million Song 數(shù)據(jù)集:Kaggle 上元數(shù)據(jù)豐富的大型開源數(shù)據(jù)集,可以幫助人們使用混合推薦系統(tǒng)。
  • 地址:https://www.kaggle.com/c/msdchallenge
  • Last.fm:音樂(lè)推薦數(shù)據(jù)集,可訪問(wèn)深層社交網(wǎng)絡(luò)和其它可用于混合系統(tǒng)的元數(shù)據(jù)。
  • 地址:http://grouplens.org/datasets/hetrec-2011/
  • Book-Crossing 數(shù)據(jù)集:來(lái)自 Book-Crossing 社區(qū)。包含 278,858 位用戶提供的約 271,379 本書的 1,149,780 個(gè)評(píng)分。
  • 地址:http://www.informatik.uni-freiburg.de/~cziegler/BX/
  • Jester:來(lái)自 73,421 名用戶對(duì) 100 個(gè)笑話的 410 萬(wàn)個(gè)連續(xù)評(píng)分(分?jǐn)?shù)從-10 至 10)。
  • 地址:http://www.ieor.berkeley.edu/~goldberg/jester-data/
  • Netflix Prize:Netflix 發(fā)布了他們的電影評(píng)級(jí)數(shù)據(jù)集的匿名版;包含 480,000 名用戶對(duì) 17,770 部電影的 1 億個(gè)評(píng)分。首個(gè)主要的 Kaggle 風(fēng)格數(shù)據(jù)挑戰(zhàn)。隨著隱私問(wèn)題的出現(xiàn),只能提供非正式版。
  • 地址:http://www.netflixprize.com/

————————我是深度學(xué)習(xí)圖表的分割線————————

網(wǎng)絡(luò)和圖形

  • Amazon Co-Purchasing:亞馬遜評(píng)論從「購(gòu)買此產(chǎn)品的用戶也購(gòu)買了……」這一部分抓取數(shù)據(jù),以及亞馬遜相關(guān)產(chǎn)品的評(píng)論數(shù)據(jù)。適合在網(wǎng)絡(luò)中試行推薦系統(tǒng)。
  • 地址:http://snap.stanford.edu/data/#amazon
  • Friendster 社交網(wǎng)絡(luò)數(shù)據(jù)集:在變成游戲網(wǎng)站之前,F(xiàn)riendster 以朋友列表的形式為 103,750,348 名用戶發(fā)布了匿名數(shù)據(jù)。
  • 地址:https://archive.org/details/friendster-dataset-201107

語(yǔ)音數(shù)據(jù)集

  • 2000 HUB5 English:最近在 Deep Speech 論文中使用的英語(yǔ)語(yǔ)音數(shù)據(jù),從百度獲取。
  • 地址:https://catalog.ldc.upenn.edu/LDC2002T43
  • LibriSpeech:包含文本和語(yǔ)音的有聲讀物數(shù)據(jù)集。由多個(gè)朗讀者閱讀的近 500 小時(shí)的各種有聲讀物演講內(nèi)容組成,包含帶有文本和語(yǔ)音的章節(jié)。
  • 地址:http://www.openslr.org/12/
  • VoxForge:帶口音的清晰英語(yǔ)語(yǔ)音數(shù)據(jù)集。適用于提升不同口音或語(yǔ)調(diào)魯棒性的案例。
  • 地址:http://www.voxforge.org/
  • TIMIT:英語(yǔ)語(yǔ)音識(shí)別數(shù)據(jù)集。
  • 地址:https://catalog.ldc.upenn.edu/LDC93S1
  • CHIME:嘈雜的語(yǔ)音識(shí)別挑戰(zhàn)數(shù)據(jù)集。數(shù)據(jù)集包含真實(shí)、仿真和干凈的錄音。真實(shí)錄音由 4 個(gè)揚(yáng)聲器在 4 個(gè)嘈雜位置的近 9000 個(gè)錄音構(gòu)成,仿真錄音由多個(gè)語(yǔ)音環(huán)境和清晰的無(wú)噪聲錄音結(jié)合而成。
  • 地址:http://spandh.dcs.shef.ac.uk/chime_challenge/data.html
  • TED-LIUM:TED 演講的音頻轉(zhuǎn)錄。1495 個(gè) TED 演講錄音以及這些錄音的文字轉(zhuǎn)錄。
  • 地址:http://www-lium.univ-lemans.fr/en/content/ted-lium-corpus

————————我是深度學(xué)習(xí)音頻的分割線————————

音符音樂(lè)數(shù)據(jù)集

  • Piano-midi.de: 古典鋼琴曲
  • 地址:http://www.piano-midi.de/
  • Nottingham : 超過(guò) 1000 首民謠
  • 地址:http://abc.sourceforge.net/NMD/
  • MuseData: 古典音樂(lè)評(píng)分的電子圖書館
  • 地址:http://musedata.stanford.edu/
  • JSB Chorales: 四部協(xié)奏曲
  • 地址:http://www.jsbchorales.net/index.shtml

其它數(shù)據(jù)集

  • CMU 動(dòng)作抓取數(shù)據(jù)集:http://mocap.cs.cmu.edu/
  • Brodatz dataset:紋理建模。
  • 地址:http://www.ux.uis.no/~tranden/brodatz.html
  • 來(lái)自歐洲核子研究中心的大型強(qiáng)子對(duì)撞機(jī)(LHC)的 300TB 高質(zhì)量數(shù)據(jù)。
  • 地址:http://opendata.cern.ch/search?ln=en&p=Run2011A+AND+collection:CMS-Primary-Datasets+OR+collection:CMS-Simulated-Datasets+OR+collection:CMS-Derived-Datasets
  • 紐約出租車數(shù)據(jù)集:由 FOIA 請(qǐng)求而獲得的紐約出租車數(shù)據(jù),導(dǎo)致隱私問(wèn)題。
  • 地址:http://www.nyc.gov/html/tlc/html/about/trip_record_data.shtml
  • Uber FOIL 數(shù)據(jù)集:來(lái)自 Uber FOIL 請(qǐng)求的紐約 4.5M 拾取數(shù)據(jù)。
  • 地址:https://github.com/fivethirtyeight/uber-tlc-foil-response
  • Criteo 點(diǎn)擊量數(shù)據(jù)集:來(lái)自歐盟重新定位的大型互聯(lián)網(wǎng)廣告數(shù)據(jù)集。
  • 地址:http://research.criteo.com/outreach/

健康 &生物數(shù)據(jù)

  • 歐盟傳染病監(jiān)測(cè)圖集:http://ecdc.europa.eu/en/data-tools/atlas/Pages/atlas.aspx
  • 默克分子活動(dòng)挑戰(zhàn):http://www.kaggle.com/c/MerckActivity/data
  • Musk dataset: Musk dataset 描述了以不同構(gòu)造出現(xiàn)的分子。每個(gè)分子都是 musk 或 non-musk,且其中一個(gè)構(gòu)造決定了這一特性。
  • 地址:https://archive.ics.uci.edu/ml/datasets/Musk+(Version+2)

政府&統(tǒng)計(jì)數(shù)據(jù)

  • Data USA: 最全面的可視化美國(guó)公共數(shù)據(jù)。
  • 地址:http://datausa.io/
  • 歐盟性別統(tǒng)計(jì)數(shù)據(jù)庫(kù):http://eige.europa.eu/gender-statistics
  • 荷蘭國(guó)家地質(zhì)研究數(shù)據(jù) :http://www.nationaalgeoregister.nl/geonetwork/srv/dut/search#fast=index&from=1&to=50&any_OR_geokeyword_OR_title_OR_keyword=landinrichting*&relation=within
  • 聯(lián)合國(guó)開發(fā)計(jì)劃署項(xiàng)目:http://open.undp.org/#2016

【本文是51CTO專欄機(jī)構(gòu)“機(jī)器之心”的原創(chuàng)文章,微信公眾號(hào)“機(jī)器之心( id: almosthuman2014)”】

戳這里,看該作者更多好文

責(zé)任編輯:趙寧寧 來(lái)源: 51CTO專欄
相關(guān)推薦

2023-09-01 14:02:25

用戶分析攻略

2018-07-31 14:58:08

2018-09-03 09:00:00

前端ReactVue.js

2020-06-01 15:04:44

甲骨文自治數(shù)據(jù)庫(kù)

2019-01-17 08:16:05

MySQL規(guī)范數(shù)據(jù)庫(kù)

2022-04-29 08:48:25

開源

2020-07-15 15:38:15

人臉識(shí)別照片活化手機(jī)

2019-07-16 07:52:49

NumPyPython機(jī)器學(xué)習(xí)

2020-07-28 17:34:42

攜號(hào)轉(zhuǎn)網(wǎng)運(yùn)營(yíng)商套餐

2018-06-03 16:16:41

面試AI人工智能

2019-01-21 05:08:15

IGMPTCPIP

2023-03-21 09:44:34

模型AI

2021-10-22 06:04:05

勒索軟件攻擊報(bào)告

2020-03-06 15:38:10

編程語(yǔ)言PythonJava

2018-05-15 09:15:03

CNN卷積神經(jīng)網(wǎng)絡(luò)函數(shù)

2017-11-08 11:42:51

2010-12-01 13:05:11

Nikto

2023-09-26 11:03:42

數(shù)據(jù)中心服務(wù)器

2018-09-20 05:01:06

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)