自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

我是誰?大數(shù)據(jù)與DNA解答人類大困惑

云計算
系譜學(搜尋并考證人類祖先)的下一階段,將很快得到實現(xiàn)。大量累積的、數(shù)字化的可訪問數(shù)據(jù)結(jié)合DNA檢測的最新進展,意味著人類對家庭的困惑——他們是誰?他們怎樣到達這里?他們?nèi)绾侮P(guān)系到我們?——這些很快能得到解答。實際上,對家族史(假定家族史存在)的追求不會超過20年:大部分的奧秘正在快速消亡。

導讀:據(jù)國外科技媒體TheVerge報道,對人類祖先的永恒探求正走向結(jié)局。

系譜學(搜尋并考證人類祖先)的下一階段,將很快得到實現(xiàn)。大量累積的、數(shù)字化的可訪問數(shù)據(jù)結(jié)合DNA檢測的最新進展,意味著人類對家庭的困惑——他們是誰?他們怎樣到達這里?他們?nèi)绾侮P(guān)系到我們?——這些很快能得到解答。實際上,對家族史(假定家族史存在)的追求不會超過20年:大部分的奧秘正在快速消亡。

因此,我們是誰?我們怎么到達這里?我們從何而來?我們?nèi)ネ翁?

上帝之子

對祖先的興趣可以追溯到歷史本身,但對于地球早期的人類來說,只有皇室和超級富豪才能研究血親家系,目的是鞏固權(quán)力與財富。然而,現(xiàn)代愛好者家譜目前的做法,則植根于1845年在波士頓創(chuàng)立的新英格蘭歷史家譜協(xié)會,使用家庭“樹”推廣系統(tǒng)圖表。19世紀20年代John Farmer發(fā)展了家庭樹,并沿用至今。在接下來的10年,類似協(xié)會在紐約建立,之后,尋找與開國元勛和其他革命戰(zhàn)爭人物間的關(guān)系十分普遍。“當美國革命之女創(chuàng)建后,五月花協(xié)會也隨之創(chuàng)建,”托馬斯·麥克恩特說,“這就是我所說的系譜學的第一階段”。美利堅聯(lián)邦共和國一成立,美國的系譜學就隨之應運而生。

新英格蘭歷史家譜協(xié)會成立后不到50年,美國系譜學領(lǐng)域最重要的角色誕生了,就是西部的鹽湖城。

托馬斯·麥克恩特表示,鹽湖城是家族史研究的“麥加”圣地。因為,鹽湖城也是耶穌基督后期圣徒教會及其家庭史圖書館的所在地,教會創(chuàng)建于1804年,是猶他州家譜協(xié)會;家庭歷史圖書館這是系譜學界最大的圖書館,而其在線門戶網(wǎng)站FamilySearch,日均瀏覽量約為1000萬。

摩門教的基礎(chǔ)教義之一即是家譜

1847年,楊百翰和其他一些后期圣徒創(chuàng)建了鹽湖城,鹽湖城人口剛過100萬,其中半數(shù)為后期圣徒教會成員。家庭史圖書館贊助與合作伙伴服務部高級副總裁唐納德·安德森稱,摩門教堅信“永恒的家庭”,堅信家庭有能力去“在生命之外延續(xù)”。因此考證祖先是“摩門教義的重要部分”。站在大型銀行的微電影當中,他說,“我們都是上帝之子”。

摩門教的基本教義之一就是進行系譜學研究,因為其成員們相信摩門教可以為死去的祖先施洗入教。由代理人施洗家族的行為——即,不知道祖先或未經(jīng)祖先允許,因為祖先們通常都已過世——備受爭議,但那并不是多數(shù)系譜學者關(guān)注的焦點。FamilySearch和家族史圖書館工作人員歡迎摩門教徒和非魔門教徒,因為圖書館的使用,已經(jīng)遠遠超過其宗教目標,且后期圣徒堅信他們的信息傳播甚廣,且所有信息全部免費。

家族史圖書館是一幢角狀的不規(guī)則現(xiàn)代建筑,每周六天對外開放,所有服務均免費。家族史圖書館收集了全球最多的與家譜研究相關(guān)的文檔資料、圖書和微電影,因而每年吸引了50萬人來此參觀,其中許多都是系譜學愛好者,或是專業(yè)系譜學者,他們不信仰摩門教。

后期圣徒開始于20世紀30年代末期,他們承辦了一個巨型計劃,那就是在全球范圍內(nèi)尋找系譜學記載并制作成微電影。借助志愿者和傳教士大軍,后期圣徒會參觀了全球政府和教堂(教堂中保存了大量記載,直到20世紀之交),使用了240萬微縮膠卷。家族史圖書館還招募了4600位志愿者,在全球范圍內(nèi)的家族史中心工作。家族史中心是小型研究便利機構(gòu),贊助者可以在主要的圖書館訂購微電影和圖書,然后通過離家近的線下工廠寄送。但在臟兮兮的圖書館(家族史中心是藝術(shù)殿堂,實際上一點都不臟),在那些長期被遺忘的泛黃的文件中發(fā)掘數(shù)據(jù),將迅速走向歷史。感謝互聯(lián)網(wǎng)。

“看起來似乎互聯(lián)網(wǎng)為系譜學而生”

對家人的研究過程艱苦,往往吃力不討好,直到互聯(lián)網(wǎng)出現(xiàn)。與多數(shù)人一樣,如果你從頭開始——可能你知道四位祖父母的名字,其他所知甚少——就這樣開始研究幾乎完全不可能。托馬斯·麥克恩特的研究開始于20世紀70年代,他說,“不得不直接去檔案館或者倉庫”。他很幸運,就讀了位于華盛頓特區(qū)的一所大學,國家檔案館就在華盛頓特區(qū),那里保留了美國人口普查和軍事記載的所有收集資料。“全都是紙質(zhì)版本”,他說。記載要么是紙質(zhì)版,要么是微縮膠卷。訪問資料需要實地前往,如果實地訪問失敗的話,就需要一封郵件命令。所有記載當然不可能有索引,因此你得準確知道你需要什么東西:如果你在尋找祖父母的死亡證明,但又不知道確切的死亡日期,那么事情很難辦到。當然,所有的家庭樹圖表,也是紙質(zhì)版的,因此也很難確定一個表親與另一表親間的關(guān)系。直到2000年中,這些信息幾乎都不能在線閱覽?,F(xiàn)在,除了某些重大記載(國家法律確定其可用性)和許多軍事服務檔案外,幾乎所有的記載,都有電子版本。

大數(shù)據(jù)結(jié)合DNA檢測

3月,近7000人趕至鹽湖城的鹽宮會議中心,在RootsTech中度過周末。RootsTech是一個年度專注于技術(shù)的系譜學會議,由非盈利家族組織FamilySearch和其他一些大牌家族行業(yè)贊助。當前系譜學的技術(shù)并不總是完全可靠,但RootsTech會議講述并鼓勵兩人發(fā)展關(guān)系。傳統(tǒng)而言,近退休年紀的人(多數(shù)為女性)希望找到家族組織的這個愛好,在當前是產(chǎn)值達到10億美元的行業(yè),且年輕人口越來越多。

過去幾年,尋找并圖表描繪家族史已變成一種潮流,開始搜尋的技術(shù)也變得更加簡單。許多企業(yè)如Ancestry.com和FamilySearch等耗費近十年時間,將他們擁有的工具、文件記載和數(shù)據(jù)等放在網(wǎng)上,供使用者進行互聯(lián)網(wǎng)查詢,這帶來了家譜研究革命——同時,大幅降低搜尋過程的進入門檻。過去老人或擁有可支配收入的專業(yè)人士才能參與的事情,現(xiàn)在則迅速變成更為主流的追求。只需穩(wěn)定的網(wǎng)絡連接和一臺筆記本電腦,就能一窺過去。

DNA檢測幾年前還需要花費數(shù)千美元,且僅能提供極少的家譜信息。而現(xiàn)在,越來越多的消費者選擇采用DNA檢測,追溯至數(shù)百年前,獲取做夢也想不到的大量的關(guān)于人類祖先的信息。

植根于普洛佛的家庭樹——Ancestry.com

Ancestry.com總部位于猶他州普洛佛市的一座山腳下,距鹽湖城僅45英里。Ancestry.com創(chuàng)建于1990年,創(chuàng)始人為保爾·B·艾倫(不是微軟的保爾·艾倫)、丹·塔格特(同為楊百翰大學摩門教畢業(yè)生)。企業(yè)最初作為信息庫為人所知,后來則因在軟盤上分發(fā)圣徒出版物而知名。早年Ancestry.com是一家軟件公司,他們在艾倫的汽車旁銷售帶有圣徒出版物文檔的軟盤,每份300美元。到1995年,二人將精力放在互聯(lián)網(wǎng)上,Ancestry.com迅速成為在線家譜研究的領(lǐng)頭羊。創(chuàng)建在線家庭樹、索引和記載的工具對外免費,但歷史文檔的真實掃描圖片需要付費瀏覽。通過付費用戶,企業(yè)賺取了大筆收入。現(xiàn)在,擁有全部訪問權(quán)限的用戶每年服務費用為359美元——每月30美元左右——付費用戶則超過了200萬。

Ancestry的記載包羅萬象,這意味著所有人都可以搭建自己的家庭樹。一旦用戶找到某個記載——比如說,20世紀40年代的人口普查圖——他(她)相信祖父的姓名也在人口普查圖中,那么他可以將該記載鏈接到家庭樹上寫有祖父姓名的地方。用戶的家庭樹可以是隱私的,也可以與其他人共享,并將自己的家庭樹鏈接到他人的家庭樹上。Ancestry記載功能強大、性能集中,可以合并用戶幾乎所有的研究數(shù)據(jù)。許多年前,等量的人類信息就已經(jīng)填滿了手寫活頁夾與復印紙活頁夾的貨架,沒法簡單進行分享。

Ancestry.com是系譜學領(lǐng)域最出名的企業(yè)

Ancestry公司CEO蒂姆·沙利文在RootsTech會議上做了主題演講,他為Ancestry工作了10年。在那之前,他先是世界上最大的婚戀約會網(wǎng)站Match.com的COO,然后擔任了Match總裁,他也曾任職于TicketMaster和迪士尼。在沙利文的領(lǐng)導下,Ancestry變成系譜學領(lǐng)域最知名——可能也是最成功的企業(yè)。但他仍然平易近人,不似其他多數(shù)CEO。當我們走過會展中心的大廳,想找個可以交談的安靜地方時,其他人圍過來,對著我們微笑,偶爾也靠近他。“過去五年來,我們一直在搜尋,”但是現(xiàn)在“家族史完全社交化.”人們在一起工作——不管他們知不知道——這改善了他們自己的個人家庭樹,也改善了企業(yè)數(shù)據(jù),因為企業(yè)可以將他們的信息拼接在一起。

沙利文的觀點十分正確,Ancestry的早期成功幾乎可以完全歸功于數(shù)據(jù)搜尋,Ancestry提供了不太匹配但不斷改善的搜索算法。基因搜索引擎如谷歌等不能分辨姓與名,而這往往意味著此類工作的全部不同之處,尤其有些祖先的名字相當常見如史密斯或泰勒。但Ancestry(和其他類似企業(yè))創(chuàng)建了特制的用于單一目的的搜索引擎,這種搜索引擎能處理一種需求:與姓相關(guān)聯(lián)的名(包括變化多端的拼寫的不同組合)、日期范圍、特定范圍或?qū)捰蛭臋n搜索、寬地理位置(如某一國家)或特定地理位置(如某個小鎮(zhèn))、一些出生日期、出生地點、其他人(如親戚家的小孩)的名字等。這款搜索引擎每日處理約4500萬次搜索量(谷歌搜索數(shù)據(jù)約為30億),或許不盡完美,但功能非常強大,且在不斷修改升級。搜索結(jié)果反饋每次數(shù)百條,按匹配度排名。通過挖掘大量的文檔和聯(lián)系數(shù)據(jù)庫,Ancestry也能自動推送“線索”——通過驚人的圖文并茂的家庭樹之葉展示——基于用戶的家庭樹,指向潛在親戚和主要來源。最近,它還首次亮相Facebook分享功能,用戶可以將自己和家人的Facebook賬號鏈接到家庭樹中,這同樣提高了企業(yè)搜索的能力。#p#

凱蒂的家庭樹

 

 

凱蒂·諾托普洛斯就是系譜學家,技術(shù)上的進步是這些變成可能。她自我描述為“業(yè)余愛好者系譜學家”,作為BuzzFeed編輯,凱蒂大約五年前開始了家譜研究。當時,一位朋友告訴她研究家譜的很有趣很好玩。她不參加系譜學會展,也不去沖洗墓碑上看不清的日期。“我只在網(wǎng)上研究”,她說,而這在幾年前完全不可能。

“我認為系譜學一門滯后于技術(shù)的行業(yè),”麥克恩特說,可能因為記載的擁有者——小教會和當?shù)卣?mdash;—沒花錢去將他們的記載進行微影像化、徹底地目錄化(后來數(shù)字化)。 通常,小的縣級法院只有一個人專門處理家族史記載要求。在數(shù)碼攝影、掃描軟件、OCR(光學字符識別)技術(shù)上的進展最近才帶來了成本。

為了創(chuàng)建家庭樹,我們不得不成為歷史學家、偵探、語言學家

早些時候,創(chuàng)建家庭樹是一段孤獨的路程,常常只有過度操勞的圖書管理員或檔案管理員在那,幫助我們,了解我們發(fā)現(xiàn)的東西。為了獲得成功,我們還不得不掌握系譜學、歷史學、世界大事件、過去200年的移民模式等廣泛有效的知識。所有這些都發(fā)生了變化。

凱蒂已經(jīng)創(chuàng)建了自己的家庭樹,回溯了四代血親,其中包括英國、希臘和德國祖先。使用Ancestry.com,凱蒂幾乎完成了所有工作。“最開始的時候,我找到了一個人,他已經(jīng)研究了我所在家庭的一個分支很多年,這是個重大突破。”找到另一個人——不管與她多么遠親——兩人一起為同一個計劃奮斗。她說,“這十分有用,快速追溯過去變得十分容易,這看起來超級浪漫,超級興奮。”她喜歡在碎片化的時間里進行家譜研究:坐在長條凳上,看電視的時候。正是能夠解決“這些小奇跡”,才使她養(yǎng)成了家譜研究的良好習慣。研究活動,幫助她暫時遠離“現(xiàn)實生活”,她甚至找到了第三個表弟,他也在Ancestry網(wǎng)站上研究家族的某個分支。等他們來紐約玩時,她去看他們,還共享晚餐。在研究祖輩的網(wǎng)絡世界,這種現(xiàn)象十分常見。

我們常能聽到這樣的觀點,“所有人都相互關(guān)聯(lián)”

在系譜學社區(qū),我們常能聽到這樣的觀點“所有人都相互關(guān)聯(lián)”, 觀點不完全錯誤:往前回溯10代,我們中的許多人會找到共同的連接點,但直到人們廣泛持有互聯(lián)網(wǎng),并以所有有用的組織方式使用互聯(lián)網(wǎng),這個觀點才變得正確。“看起來似乎互聯(lián)網(wǎng)是為系譜學而生,”托馬斯·麥克恩特說。他在鹽湖城Radisson舞廳舉辦了自己的生日派對,這是RootsTech的第三個夜晚。這是一個大型的友好聚會,系譜學領(lǐng)域眾多名人也紛紛參會:創(chuàng)建了Cyndi名單的Cyndi Howells也在那里,同行的還有FamilySearch和以色列企業(yè)MyHeritage的工作人員。托馬斯認識所有人,社區(qū)人員聯(lián)系緊密,每年在會議上相逢數(shù)次。

然而,其他時間里,他們在網(wǎng)上,通過互聯(lián)網(wǎng)幫助挖掘其他。系譜學的核心是追尋、搜索——有時甚至長達數(shù)年——只為找到通往另一位祖輩人物的關(guān)鍵線索。搜尋工作當然本質(zhì)上是無止境的:絕大多數(shù)人很幸運地找到了5代或6代人物圖,到那時候,他們的家庭樹將會囊括總計5000多人。

凱蒂的DNA

 

 

(圖源:23andMe)

在互聯(lián)網(wǎng)的早期,系譜學家見面的最佳場所是郵箱列表和留言板,在那里,他們集中資源,互相幫助尋找剪報或出生記錄。1984年,后期圣徒出版了系譜學文件的公開標準格式,稱作GEDCOM。元數(shù)據(jù)的純文本文件可以將文件記錄鏈接到其他文件記錄中,GEDCOM可被不同類型的專有軟件讀取,并保留標準文件格式,到現(xiàn)在依然可以。這意味著可以彼此共享大量信息——他們的發(fā)現(xiàn)、他們的家庭——以一種簡單、便攜的在線方式。小型網(wǎng)站專注于單親家庭或編制小鎮(zhèn)上的訃告名單,并在網(wǎng)站上公示。有些人走遍整塊墓地,記下每塊墓碑內(nèi)容,精心抄錄并將其登載在網(wǎng)上。本質(zhì)上受數(shù)據(jù)驅(qū)動的愛好不可能永遠滯后。“我們知道這實際上可以趕上”,托馬斯說,當然也的確做到了。到90年代中期,小型初創(chuàng)企業(yè)開始看到互聯(lián)網(wǎng)可能意味著系譜學的巨大商機,后期圣徒會也注意到了。#p#

繼續(xù)搜索

搜索是關(guān)鍵。Ancestry.com工程部副總裁斯科特·索倫森解釋道,每次搜索結(jié)果都與元數(shù)據(jù)系列緊密相連——索引、基礎(chǔ)信息如某個人的名字,也與高質(zhì)量的文件掃描緊密相連,盡管該文件可能距今數(shù)百年。“我們擁有100億份記錄文件、4PB數(shù)據(jù)與搜索結(jié)果緊密相連”。所有搜索都可能挖掘到10或數(shù)百的結(jié)果,按照匹配度結(jié)果排序。隨著每次的搜索,搜索引擎也得到改善:“消費者在網(wǎng)站上的所有交互行為,我們都能從中學習。使用機器學習技術(shù),我們可以觀察總體消費者行為,久而久之,就能改善我們的算法,因為他們持續(xù)增加數(shù)據(jù)架構(gòu)。網(wǎng)站的用戶,不斷對文件記錄進行評價,這樣我們可以從中學習。”最后,通過消費者交互行為,索引與記錄文件,同3800萬個單個的用戶創(chuàng)建的家庭樹緊密相關(guān),在不斷擴展的龐大數(shù)據(jù)矩陣上,進一步連接到其他家庭樹,數(shù)據(jù)則代表了人們的家庭。

那么記錄文件從何而來?許多來自于后期圣徒會的家庭史圖書館。Ancestry.com與大型企業(yè)、中小型企業(yè)簽訂協(xié)議,付費后,方能訪問有價值的記錄文件。自從后期圣徒會“成為第一個吃螃蟹的人”后,在很多情況下,他們的數(shù)據(jù)相當有用——例如,將人口普查數(shù)據(jù)微縮影像化。FamilySearch CEO 丹尼斯·布林哈爾表示,由于FamilySearch是一家非盈利機構(gòu)(作為教會的一部分),共享記錄文件很簡單。“我們對尋找記錄文件的人很感興趣,我們希望采用這些財務模型能有所幫助。使用我們的數(shù)據(jù)可能有效,因為我們并沒有一個財務模型,但我們真正想要做的事情是讓全球更多人可以使用更多的記錄文件。”這個想法使多數(shù)的企業(yè)考慮到系譜學商機:訪問時關(guān)鍵,不管什么人擁有什么東西,因此企業(yè)分享數(shù)據(jù),而不是通過數(shù)字化冗余復制,互相逼迫,制造“雙倍努力”。Ancestry.com也與非盈利機構(gòu)、最大的猶太人家譜網(wǎng)站JewishGen,以及全球最完整的用戶創(chuàng)建的墓碑抄錄數(shù)據(jù)庫Find A Grave建立關(guān)系。有些合作伙伴允許用戶直接訪問記錄文件,不需要離開Ancestry網(wǎng)站門戶;而有些合作伙伴,如英國重大記錄和人口普查索引等,允許用戶查看姓名和其他基礎(chǔ)信息,但如果想訪問實際圖片,用戶就需要前往該網(wǎng)站,接受網(wǎng)站的直接管理。

但同時,Ancestry在購買記錄文件上也十分活躍。斯科特·索倫森表示,Ancestry每年花費200萬美元購買新內(nèi)容。在我們參觀清潔圖書館的哪天,雇員們正在使用數(shù)碼相機和專用軟件創(chuàng)建高中年鑒的高分辨率瀏覽文件。年鑒對系譜學而言至關(guān)重要,托馬斯麥克恩特表示,“因為年鑒是找到女性姓氏的好方法,已婚婦女經(jīng)常冠以夫姓,確定女性姓氏比較困難”。Ancestry已經(jīng)購買了大量的類似“次級”來源,如城市目錄、電話薄和教會目錄。一旦掃描圖像,就能轉(zhuǎn)錄名稱,嵌入元數(shù)據(jù),同時將帶索引的圖像上傳至Ancestry網(wǎng)站。Ancestry還收購了一些其他的系譜學和檔案企業(yè)——小型競爭對手——以掌握他們的資源。2012年四月,Ancestry斥資10億美元收購了Archives.com,同年10月,收購了照片數(shù)字化服務公司1000memories。

FamilySearc也擁有類似功能網(wǎng)站,一切皆免費。當然搜索功能不如Ancestry那么強大,他們的家庭樹制作軟件業(yè)不夠健壯,但數(shù)據(jù)的大量收集每日遞增,這一增長得益于超過15萬個義務打字員,他們使用自己開發(fā)的專門的Java軟件應用程序打字抄錄。所有在家的人都可以下載該應用程序,在幾分鐘內(nèi),抄錄一系列的出生、死亡或婚姻記錄。這個過程被稱為“索引”,是FamilySearch公司最珍貴最有價值的工具之一。每年通過其成熟的轉(zhuǎn)錄和索引系統(tǒng),F(xiàn)amilySearch公司增加了4億帶有索引的有組織的圖像。這家企業(yè)——過去通過微縮膠卷和CD刻錄機分配其記錄文件——現(xiàn)在可以輕而易舉地快速移動,系譜學家可以完全使用數(shù)據(jù)。從掌握該領(lǐng)域圖片到用戶可以讀取記錄文件的處理過程,過去需要18個月,而現(xiàn)在,則只需要2個月不到,當然——是在線,而不是微縮影像。

 

 

家族史蘊含巨大商機

Ancestry.com和FamilySearch可能是在線系譜學領(lǐng)域最出名的企業(yè),但到目前為止,他們并非唯二的兩家,新企業(yè)正快速崛起,試圖分一杯羹。MyHeritage是一家以色列企業(yè),創(chuàng)建于2003年,運營服務更偏向于家族成員的社交網(wǎng)絡——不管是過世的,還是活著的人——而不是傳統(tǒng)的家庭樹。該網(wǎng)站最近成功融資2500萬美元,支持38種語言。MyHeritage早期重點關(guān)注東歐等地——Ancsetry實力較弱的地盤——MyHeritage向美國用戶提供一些相當獨特的內(nèi)容,在市場上獲得了很好的反響,發(fā)展迅速。英國的FindMyPast.com在美國也獲得不錯的進展,公司與英格蘭、蘇格蘭、威爾士政府的獨家關(guān)系從根本上為其提供了這些地區(qū)的重要記錄的壟斷優(yōu)勢。公司CEO克里斯·范·科爾同時也是4J工作室總裁,4J工作室負責制作游戲《上古卷軸:湮沒》在索尼掌機PS3上的移植和Xbox版Minecraft游戲。他自我形容為“技術(shù)極客”,并從該角度思考系譜學。他很偶然地進入家族史行業(yè),彼時,朋友請他申請某系譜學企業(yè)軟件的一些用戶體驗創(chuàng)建技巧。5年后,他仍然在這個行業(yè),執(zhí)掌英國最強大的家族史來源。“授權(quán)技術(shù)后,越來越多的人獲得正確的技術(shù),并帶來他們自己的數(shù)據(jù)和自己的經(jīng)驗,所有人就能在更大的范圍內(nèi)做得更好。我們的使命是創(chuàng)造最驚人的家族史體驗,為盡可能多的人發(fā)掘他們的故事。”

到2010年,Ancestry已經(jīng)與NBC合作,向主流美國觀眾推出《你認為你是誰?》的英國電視節(jié)目。節(jié)目特邀專業(yè)系譜學家與知名人物如莎拉·杰西卡·帕克、史蒂夫·布西密、斯派克·李等合作,開始他們的祖先故事搜尋之旅。2012年十月,Ancestry.com——這時已經(jīng)上市——被一些投資者和歐洲私募股權(quán)機構(gòu)Permira顧問有限公司以16億美元的金額收購,其中包括公司CEO蒂姆·沙利文。確實,家族史蘊含著巨大的商機,但在線搜索文檔并不是知道我是誰的唯一方法。如果我們想嚴肅思考、放眼未來,那么我們不得不丟開某些東西。#p#

一模一樣:DNA解決問題

在山景城,谷歌總部的角落附近,坐落著23andMe公司總部。2006年四月,一小群人創(chuàng)建了這家公司,其中就有生物學家安妮·沃西基,她嫁給了谷歌聯(lián)合創(chuàng)始人謝爾蓋·布林。23andMe是一家個人基因公司,主要目標為讓人們自己掌握自己的健康,公關(guān)總監(jiān)凱瑟琳·阿法連介紹到。盡管這聽起來只是個簡單的愿景,在短短幾年前,卻是聞所未聞。

出于對科技與自己最近的研究發(fā)現(xiàn)間的匹配度的好奇,凱蒂最近接受了23andMe的DNA檢測和Ancestry公司的DNA檢測。她注冊了網(wǎng)站賬號,預定DNA測試,等輪到她后,輸入網(wǎng)站的條形編碼。八周后,個人祖先與健康結(jié)果顯示在她的收件箱中。

測試推出后,售價為999美元,相當便宜。但考慮到所有情況,也不是任何人都能買得起。去年12月,自宣布已經(jīng)積累了18萬個DNA檢測數(shù)據(jù)庫后,23andMe將檢測成本永久降低至99美元,以獲取大筆融資,并宣布今年目標為積累100萬個檢測數(shù)據(jù)庫。盡管僅有2%的美國人接受了類似檢測,23andMe的研究表明,近71%的人雖沒有接受檢測,但他們很有興趣。

DNA如何繼承

 

 

Ancestry和23andMe的系譜學DNA結(jié)果都有相似性能。一旦處理結(jié)果——兩家企業(yè)都將測試結(jié)果傳給實驗室萃取,然后進行室內(nèi)研究——用戶可以登錄賬號,查看祖輩DNA的近似組成,可追溯至500年前。例如,如果我們的祖父母是波蘭和愛爾蘭混血,那么我的DNA結(jié)果不一定密切反映這一結(jié)果,但他們告訴我們10代以前的家人來自哪里。兩種測試的結(jié)果都以地圖形式展現(xiàn)(如圖所示)。“有點混亂,Ancestry測試顯示我有17%的斯堪的納維亞DNA,但我的研究中并沒有發(fā)現(xiàn)任何斯堪的納維亞人。”凱蒂表示,這打開了系譜學家追求的過去被忽視的領(lǐng)域新大門。

盡管23andMe在線推送某些祖先結(jié)果,其“祖輩組成”功能——在22個全球人口基礎(chǔ)上,提供了相當明確、先進的信息——2012年8月推出,3個月后,Ancestry.com也推出了新的DNA檢測功能。23andMe和Ancestry.com現(xiàn)在都提供一樣的測試類型:正染色體DNA檢測提供所有人的具體的祖先信息。早期女性檢測只能測試MtDNA,且只提供來自母親的祖輩結(jié)果:實在是很不具體、不實用。兩家企業(yè)推出更強大的檢測后,成本驟降,意味著更多的人會去注冊賬號、檢測DNA。今年3月,Ancestry宣布其數(shù)據(jù)庫已擁有12萬多個DNA檢測結(jié)果。

但怎么進行分析呢?意料之中地,分析很復雜,而且很無趣,23andMe高級研究總監(jiān)表示?;旧?,我們的DNA檢測使用數(shù)百個“記號”,并與全球系譜學人口的常見“記號”進行比對。有些記號與特定地點有很強的關(guān)聯(lián)性,結(jié)果也會更加可靠,然而有些記號——比如與中歐、法國、德國有關(guān)的信號——則遠沒有那么可靠,很難做出高準確度的區(qū)分。處理過程則更加負責,事實上,在幾個世紀內(nèi),隨著人們不可避免地遷移和移民,現(xiàn)在活著的多數(shù)人擁有多種祖先。

因此,如果我們做了檢測,我們的DNA將與一整套的“參考”測試進行比對,參考測試收集了數(shù)千個人的DNA,他們資料完善,有較精準的系譜學位置。在最簡單的模式中,DNA與這些參考數(shù)據(jù)集匹配的地方,可以推出祖先來自那些區(qū)域的百分比。

23andMe和Ancestry.com的DNA網(wǎng)站次級卻可能更強大的功能提供了一些其他完全類似的比對方法:向用戶展示可能與他們有親戚關(guān)系的做了同樣測試的人。兩個網(wǎng)站都提供匹配度的可靠性比例,因此,舉例來說,匹配度可能表明“有95%的可能性表明,某位成員X是四代或六代表親。”如今,六代表親是很遠的遠親,但二代或三代表親(Ancestry.com檢測的許多人,找到了1至2個有如此近親關(guān)系的人)就不一樣了。二代表親是我們一代表親(父母的兄弟姐妹的孩子)的孩子;三代表親意味著你和其他人的曾祖父母是同一個人。平均而言,23andMe表示,參與檢測的每個人都能在數(shù)據(jù)庫中找到1000多個基因匹配。用戶可以選擇聯(lián)系他們——先匿名——來進行信息比對。很顯然,參與檢測的人越多,找到匹配的人越多,匹配的準確率也隨之提高,因此,兩家公司都大力推動越來越多的人參與檢測,也幫助解釋了最近的大減價行為——永遠的降至99美元。

我們正在接近未來過去祖先的奧秘將不復存在

“我們可以創(chuàng)建一個全新的市場,客戶們可以發(fā)現(xiàn)家族史,無需研究老的歷史文檔,”蒂姆·沙利文把最近的發(fā)展稱作是“人類基因?qū)W的革命”。Ancestry.com直接將用戶DNA檢測鏈接至家庭樹上,23andMe功能沒那么強大,但也允許用戶將GEDCOM文件上傳至網(wǎng)站,同時將數(shù)據(jù)鏈接至家庭樹上。系譜學的個人DNA檢測至今仍不普遍,也沒能發(fā)揮其全部潛能,但未來已不再遙遠。

但對于只喜歡挖掘文檔(無論是線上文檔還是線下文檔),搜尋任何能他們與過去相連的細微線索的人來說,這又意味著什么呢?在最短的短期內(nèi),搜尋工作還會繼續(xù)。但是事實上,接下來的5到10年,知道哪怕幾代以前的祖先是誰,會變得越來越簡單,只需相對較少的努力:系譜學疑惑是技術(shù)可以解決,且已經(jīng)奠定了基礎(chǔ)的問題。在更遠的未來,完全可以相信類似“誰是我的曾祖母”這樣的血脈問題將不復存在。Facebook等社交網(wǎng)絡為未來親屬關(guān)系文檔奠定了基礎(chǔ),他們扮演著至關(guān)重要的角色——我們創(chuàng)建了比過去多得多的數(shù)據(jù)。不難想象到,我們多數(shù)人的祖先的奧秘未來將不復存在。

所有的數(shù)據(jù)引領(lǐng)我們了解到的所有的“故事”。我們不僅僅通過圖表上列出的出生證明、出生日期與過去相連,還通過在我們之前的人的故事,與過去相連。過去10年,系譜學作為一種愛好,已經(jīng)獲得了成倍增長,則歸因于大量的可搜索數(shù)據(jù)累積在互聯(lián)網(wǎng)上:通過Ancestry.com等企業(yè)、通過政府、通過個人。這股潮流未來只會加速發(fā)展,人們能更方便地在有限時間或資源內(nèi)研究系譜學。凱蒂表示,“對我來說,我很快從意識到’他們是我的親戚’中脫身,只一心去發(fā)掘那些還活著的人,從中學習歷史。我都沒法想象‘啊,我找到了我想要知道的所有事情,這是個秘密’。”很不幸,對于那些熱愛搜尋的人來說,未來就是一次減少奧秘的旅程。

責任編輯:王程程 來源: 中云網(wǎng)編譯
相關(guān)推薦

2012-02-29 08:48:43

大數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)

2018-03-28 14:58:42

虛擬機內(nèi)核系統(tǒng)

2015-07-28 13:36:19

互聯(lián)網(wǎng)互聯(lián)網(wǎng)+

2020-04-22 10:15:33

DNA數(shù)據(jù)存儲

2015-06-08 10:22:40

基因亞馬遜谷歌

2021-03-07 22:27:23

大數(shù)據(jù)網(wǎng)絡視頻

2016-11-07 12:30:59

大數(shù)據(jù)互聯(lián)網(wǎng)

2017-07-10 10:15:34

2022-02-08 11:31:23

Linux端口命令

2022-01-13 09:58:26

Linux端口命令

2017-11-06 13:39:20

大數(shù)據(jù)隱私個人信息

2011-07-01 14:21:22

2011大數(shù)據(jù)世界論壇大數(shù)據(jù)云計算

2010-09-25 10:56:32

WebLogicJVM

2013-04-27 14:39:40

大數(shù)據(jù)全球技術(shù)峰會

2015-07-20 16:32:27

大數(shù)據(jù)新時代

2022-09-16 10:01:58

編程

2013-08-05 10:19:34

小時代電影大數(shù)據(jù)

2020-03-27 11:39:24

大數(shù)據(jù)云計算綜合科技

2018-01-11 16:17:12

物聯(lián)網(wǎng)大數(shù)據(jù)Hadoop

2012-12-11 10:39:08

點贊
收藏

51CTO技術(shù)棧公眾號