旅美24年台灣AI科學家提醒:歐美病毒恐愈傳愈有攻擊力

m
mise88
楼主 (北美华人网)
原文:https://futurecity.cw.com.tw/article/1319

3月9日深夜11點多,一個匯聚台美智慧醫療專家的LINE群組,有人上傳了一張圖像——點點綠紅色星火從右下角核心向四周迸裂,拉出一道道白光,美得像跨年煙火,又像滿天星斗移動軌跡。 「這是3月5日為止,全球約250株已經定序病毒的基因演化樹,」說話的是圖策智能(Graphen)執行長林清詠。截至3月11日,這個用人工智慧畫成的新冠病毒基因演化樹,已呈現近400株、來自30多國的病毒株。
人工智慧界無人不識林清詠——他在IBM任職近17年,曾是首席科學家暨超級電腦部門華生(Watson)網路與人工智能創辦人,也是哥倫比亞大學兼任教授,還曾登上美國《商業周刊》(BusinessWeek)封面。2017年,他在紐約成立AI新創公司圖策智能。 「台灣有兩株在最大的原始型態中,有兩株來自左方一大堆子孫變型的原型。這個變型很會傳播,其中一支到新加坡,然後繼續變型到澳大利亞;另一支到英國,還有一支到廣東,」林清詠對群組裡兩百多人解釋這張病毒譜系。 原來,一個紅點,代表一個已完成基因定序的病毒;一個綠點,代表一群有共同基因序的病毒組;白線則是個病毒的關聯。點到一個綠點,就能秀出這組病毒的傳染路徑。
歐美各有一組傳染力超強病毒株2月底,林清詠發現有人討論病毒的分類與來源,找了報導與論文後,發現「公衛界要解決的問題,我們可以解決!」隨即在GISAID資料庫找到250個病毒株的基因資料,花了一週用AI跑出關係圖,再花幾天編修使用介面,便有了現在的樣貌,還能依照國家、性別等變數搜尋。
由於圖策做過醫療、洗錢、社群傳播等領域,處理是數百萬筆的連結大數據,擅長分析個體與整體的關係及互相影響;這次病毒僅數百筆,技術上並不難。


這張圖一發表,隨即引起福斯、NBC、ABC、彭博等美國主流電視媒體關注;隔天、紐約時間早上九點半,林清詠在第五大道的辦公室,接受「未來城市@天下」越洋專訪。 攤開這張錯綜複雜的圖,可看出兩株感染力超強的病毒組—一株在中國、澳洲、亞洲各國傳播後一個月後,1月24日變異成另一支病毒傳進華盛頓州;另一支則在1月28日傳進德國,2月底時在義大利、芬蘭、瑞士、荷蘭等國爆發,最後傳遍整個歐洲。
在美國華盛頓州造成大感染的病毒株(箭頭處) 林清詠用分享螢幕向「未來城市@天下」記者解釋,美國各州的感染源都來自十分接近同一原型的病毒株,這些患者入境美國後,可能因落實隔離,伊利諾州、麻州、德州等地的病毒都停止擴散;唯獨華盛頓州這名病患造成潛伏傳染,在一個月後、2月20日起,在當地造成群聚感染,最後出現出11種變異;其中一種變異株還造成了加洲至尊公主號遊輪上的傳播(日本的鑽石公主號則是由原型病毒造成)。 從新聞推測,群聚感染發生在西雅圖的一所養老院;偏偏加州舊金山與華盛頓州西雅圖為美國西部科技重鎮,企業往來頻繁,病毒可能因此又傳到加州,造成擴散。 截至3月14日,美國華盛頓州與紐約州疫情最嚴重,確診人數高達509與421人。紐約州尚未上傳病毒株,無從得知傳染途徑;但美國媒體報導,紐約州有50位病患可追蹤到同一個感染源——一位在曼哈頓中央車站附近工作的50歲律師,因參加大型活動,不到10天就感染超過100人,使距離紐約市25英里的小鎮新羅謝爾(New Rochelle)緊急封城。
「遇到傳染力很強的病毒,就必須採取積極手段,比如封城,」林清詠認為,將傳染途徑視覺化,更能凸顯某些傳播速度特別快的病毒株,提醒防疫單位注意。


主要在歐洲流傳的病毒株(箭頭處) 台籍婦人染歐洲病毒,或將亞洲病毒帶去歐洲?再來看歐洲。可能因國境相連,病毒如煙火般四射,出現三組主要病毒組與多個小支線。
從義大利、荷蘭與英國威爾斯回報的三隻病毒,經過變異後一支傳到瑞士,另一支則北上到芬蘭、盧森堡;還有一隻病毒則原本來自澳洲,傳遍整個歐洲,最後使去埃及旅遊的台灣婦人遭感染。由此亦可證實,埃及認為是婦人將台灣病毒傳入埃及,其實是婦人在當地感染了歐洲株病毒。 這幾天,歐洲的傳染日益加劇。3月13日,德國一口氣上傳了10個二月底採檢的病毒,竟然是從源頭長出了全新的一株病毒,在德國境內大量傳播,和歐洲其他國家大流行的病株無關。 反觀亞洲疫情,倒是逐漸平息。台灣上傳了7株病毒。從圖上可見,這些病毒都沒有繼續向外傳染,可能因為落實隔離成效好,沒有造成社區感染。 受限於各國政府上傳的病毒株數,如義大利政府僅上傳8株病毒,這張圖不一定能呈現疫情現狀;所以圖策每天會更新上傳新的病毒株,關聯圖的形狀也會變化。 待解答:病毒在什麼宿主上易生變異? 完成全球病毒株關聯圖後,林清詠看到「北京發現會攻擊中樞神經的案例」的新聞,使他好奇:武漢肺炎病毒在不健康或高齡宿主身上,是否較容易產生變異? 林清詠解釋,老人的基因複製過程中容易產生變異,容易發生癌症;而華盛頓州這一支病毒,在短時間內產生11個變異,加上病患可能多在養老院,使他有此聯想。 此外,在這張錯綜複雜的全球感染網絡中,最值得留意的是歐洲與華盛頓州的兩組病毒。
「這兩株病毒變異很多,」林清詠解釋,亞洲分出的病毒組大多「抱得緊緊的」,變異兩、三次後就會停止;但歐洲株病毒卻如蒲公英般,一團一團飛出去,且產生大量變異。


有歐洲政府認為,武漢肺炎就像流感,六、七成的人感染後就沒事了;「這是沒有公衛常識的說法!」林清詠解釋,病毒不只會傳播,還會在傳播過程中在宿主身上變異,「傳更多,變異愈多,就愈有機會累積新的攻擊能力,這才是病毒真正可怕的地方!」他在視訊會議軟體Zoom那頭強調,「不能放任它傳!」 而疫苗與藥物的研發,正是跟病毒變異速度比快、比靈活。林清詠希望,這張圖能協助生醫學者判斷合適用來容易研發疫苗的病毒株,及讓各國政府即時採取最務實的公衛政策。 [hr]科技工具箱:旅美台灣AI科學家林清詠 1970年次的林清詠台大電機研究所畢業後,取得哥倫比亞大學電機博士,專長是研究網路科學(Network Science)——從宏觀角度觀察個體與整體的關聯性,以精確預測個人行為。 2000年初,他先用這套架構分析互聯網訊息,作為反恐工具;後來又用來分析IBM員工的人際網絡,算出員工每多一個朋友,能為企業一年增加美元986的收入,因此在2009年躍上美國《商業周刊》(BusinessWeek)封面。2011年更成為國際電機電子學會(IEEE)第一位網路科學領域的會士(Fellow)。 「人的行為不是獨立的,通常會與某個模式相關,」林清詠解釋,這門學問困難之處在於處理交互影響,「一點風吹草動,個體就會影響其他整體,整體又會影響回個體。」 因此,他處理的不只是大數據,還有大數據之間的連動關係(linked big data);這種關係就像人類大腦神經元與連結的神經,要讓電腦進行人腦般複雜的記憶、思考、觀察、判斷,就需要圖運算(graph computing)技術。 研究愈做愈多後,林清詠發現最大的挑戰在於把「交互影響」用程式寫成模型。成立圖策智能時,他便把在IBM做超級電腦的同事找進團隊,花了幾年從電腦底層架構從新打底,來加快運算速度。
m
mise88
https://www.graphen.ai/covid.html 有興趣的可以去這個網站看看。
c
cherry-310
就问一句这位大爷有中国真实数据吗?
b
bigbless
整篇文章充斥着台湾一贯的小家子气
l
lilacxxt
就问一句这位大爷有中国真实数据吗?
cherry-310 发表于 3/15/2020 4:07:48 AM

病毒库的基因数据啊,怎么假?
c
cherry-310
敢问最后一次中国上传的数据是啥时候?
病毒库的基因数据啊,怎么假? lilacxxt 发表于 3/15/2020 4:21:00 AM
m
mise88
敢问最后一次中国上传的数据是啥时候?

cherry-310 发表于 3/15/2020 4:23:13 AM


https://www.graphen.ai/covid.html

The instructions are on the website itself. :
UI instruction: (1) You can use two fingers on your pad to zoom in or out. (2) To search a country, please type the country name, e.g., USA, in the Search Box. (3) You can click on a red node to see patient-related information and click on a green node to see virus mutation information. (4) Drag and drop a node can change its location; Drag and drop on background can move the whole graph.



I tried entering "china" and "after 3-14-20" and it shows 2 data points were updated on 3-14 from China.
l
lilacxxt
https://nextstrain.org/ncov?r=country 看这个,有各国分布,病毒基因序列。中国目前上传144,美国61。
v
vincentsjtu
应该变异增强了 之前中国那么严重,欧美好安静
o
overpower
f
fritillaria
网状关系太多,计算结果不怎么好。 做这种进化关系已有成熟算法,并不需要AI 呵呵
b
blackplains
mark
麻辣鸡丝22
https://nextstrain.org/ncov?r=country
看这个,有各国分布,病毒基因序列。中国目前上传144,美国61。
lilacxxt 发表于 3/15/2020 4:33:04 AM


赞高信息含量贴。用数据说话!
e
en010272
M
Mintcafe
https://nextstrain.org/ncov?r=country
看这个,有各国分布,病毒基因序列。中国目前上传144,美国61。
lilacxxt 发表于 3/15/2020 4:33:04 AM

thanks
y
yayran
如果按照欧美人种体格更健壮这种假设,病毒需要进化的更加凶猛一些才能占据优势。算是达尔文的物竞天择吧