「誒,你跟我前女友長得挺像,我差點認錯」
男生搭訕女孩,總有人用這種爛俗套近乎招數,整得大家仿佛很熟,仿佛很有緣分(手動狗頭)。
當然,不止現實搭訕,長得像「異父異母親兄弟姐妹」這件事,從來是網上玩梗打趣的熱門話題…
比如,林東臨和郭俊杰…

不光你我關心,這事兒被科學家拿來當成了研究問題,還有了結論:
相似長相的人確實「有緣」,他們可能有相似 DNA。
最新一份發表在 Cell 子刊的文章顯示,面部相似的人共享著相同基因序列。
這結論他們怎么得出的?靠譜么?
一起來看看。

請機器來找「異父異母的親兄弟」
首先要找一堆長相幾乎一模一樣的人作樣本。面對全球 70 億茫茫人海,怎么找是個問題。
科學家找到了加拿大藝術家弗朗索瓦布魯內爾 ( Fran ois Brunelle ) 。從 1999 年,這位藝術家就在全球收集相似人相。
靠著「找對門路」,科學家獲取了 32 對長相酷似的樣本,并請參與者提供了詳細的生物特征、所在地及生活方式問卷。

為保證臉部比對更客觀,科學家找來三種算法 / 模型,共同「拆解」臉部細節,判斷相似度。
其中包括了——
(1)自定義深度卷積神經網絡Custom-Net,一種來自 AI 公司 Herta,主用于監控領域的 CNN 模型;
(2)應用在 Matlab 上,常用于面部分類任務的MatConvNet;
(3)來自微軟 Azure 的Microsoft Oxford Project 人臉 API,常用于面部分析;
這些模型內置數百萬參數,且歷經上千主題下的數百萬張面部圖像訓(折)練(磨),能識別姿勢、發型、表情、年齡、配飾等諸多特征,對相似圖像,模型將給出從 0 到 1 的一個相似度區間。
如果機器們三方「會審」一致判斷極為相似,那科學家就會將樣本作為重點研究對象。最終在 32 對樣本中,有 16 對被三方認可。

之后是 DNA 比對環節。
科學家利用一種名為單核苷酸多態性(SNP) 的基因特征,比對各組長相高度相似人的唾液內 DNA 樣本。
此后,再通過無監督聚類熱圖檢測,讓機器判斷每對 DNA 是否屬于一個類型(即相似)。

結論有點因吹斯汀
結果顯示,在 16 對「被機器全部認可」樣本 DNA 中,科學家發現,有 9 對被聚成一類,他們在 3700 個基因中,共享了超過 19200 個 SNP。同樣,在 K-means 算法中,最終結論也類似。
此外,科學家還研究了相似配對的生物特征及生活方式。他們在體重、身高、是否吸煙、教育水平等方面也在配對組中相互有關聯,這說明,共享的遺傳變異不僅影響長相,也造成相似的行為和習慣。
研究者形容該結果十分「striking」。研究者還排除了近親關系的可能,并發現,這些樣本比長相不同的雙胞胎,基因相似度更高。
更有意思的是,剩下 16 組未通過三方機器視覺特征認可的樣本中,也只有一對樣本 DNA 被聚類在一個集合。
在人種和地域方面,科學家還進行祖先溯源,他們觀察到,幾乎所有相似配對樣本的祖上生活地區都很靠近。

但需要指出,本文主題在其他多組學研究中,卻有著不同結論。
比如 DNA 甲基化模式下,16 對高度相似樣本只有一堆匹配;
再比如從微生物角度看,16 對相似樣本中,口腔菌群相似的僅一對,且這對樣本通過 SNP 也沒被聚類到一起。該領域有研究認為,口腔微生物相似度與皮下脂肪有關,可能導致相似長相(如:臉上肉多)特征的人,有相似的口腔微生物特征。

團隊介紹
本文一作 Ricky S. Joshi,計算生物學家,來自西班牙巴薩羅那 Josep Carreras 白血病研究所 ( IJC ) ,研究方向主要為遺傳學和表現遺傳學,其個人頁面顯示,Ricky 致力于發現人類基因組中的病理性變異。
二作 Maria Rigau ,同樣 Base 在西班牙,是巴塞羅那超級計算中心 ( BSC ) 的博士,專業為生命科學,主頁頭像顯示,這是一位蠻喜歡狗狗的女研究者。

One More Thing
有網友指出,馬斯克長相有點像愛迪生,還 Po 了下面這張圖——

不知你怎么看?(手動狗頭)
原文地址:http://www.myzaker.com/article/63158e958e9f0949730b4f4f