每日最新頭條.有趣資訊

生命密碼:區塊鏈技術對基因組學的重要價值

編者:本文對原文作了部分刪減。查看原文全文請點擊“版權資訊”欄原文鏈接。

現如今,當圍繞著數據所有權、個人隱私展開激烈辯論的時候,我們卻忽略了對個人來說最重要的數據:基因組資訊。

不同個體的基因組中有99.9%的基因是相同的,正是那0.1%的差異決定了每個人的與眾不同——性別、體貌特徵、情緒、甚至是疾病。這些數據對我們個人來說是至關重要的。

2018年,我們看到了太多數據被損壞或者濫用的例子。對於那些想要保護自己基因組資訊的人來說,區塊鏈是對現有基因組數據市場封閉架構的一種強大的替代方案。

區塊鏈的用武之地

耗時13年,耗資37億美元的人類基因組測序計劃於2003年完成。現如今,一個人要是想進行基因測序大概只需花費1000美元,而且整個時間也縮短到了幾天。據估計,這一費用很快就會降低到100美元。

隨著基因組數據驅動的藥物設計和靶向治療的發展,製藥和生物技術公司預計將在未來幾年推動基因組數據市場的發展,到2025年這方面的投入將達到276億美元。與此同時,隨著精準醫療和基因編輯技術的革新步伐加快,個體基因中所包含的價值也將呈指數級增長。而且就在過去的一年裡,美國還史無前例地批準了新的基因療法。然而,這一過程存在著很多問題。

基因組學在推動現代醫學範式轉變上具有無與倫比的潛力,但它依賴於利用大量的數據集來建立遺傳變異和性狀之間的相關性。而想要獲得大量的基因組數據,不僅面臨著科學上的障礙,也面臨著倫理上、社會上和技術上的障礙。

對於處於這一前沿的許多研究者來說,這正是中本聰在2008年發布的白皮書、以及後來被稱為區塊鏈技術的用武之地。

George Church教授是來自哈佛大學的知名遺傳學家。他多年來一直在努力加速和推動大規模的基因組數據生成。他曾呼籲志願者為他的非營利組織個人基因組計劃(PGP)做貢獻。PGP相當於一個“維基百科”,它包含開放獲取的大約1萬個人類基因組樣本數據。

PGP依靠人們放棄隱私和數據所有權來追求科學的進步。分享數據的人要麽是“特別無私的人”,要麽是那些因為家庭經歷而關心某一特定疾病研究的人。

現在基因組學發展的限制在於如何讓所有人都參與進來,據估計,全球大約只有100萬人接受了基因組測序。

為了解決這個問題,一個通證化的、支持區塊鏈的生態系統可能成為向大眾開放的技術引爆點。通過允許人們將自己的基因組貨幣化,並將訪問權直接出售給數據購買者,區塊鏈平台可以幫助將測序成本降低到“免費甚至可以為人們提供淨利潤”。

通證化為啟用不同的場景提供了靈活性。數據所有者可以根據他們所支持的研究開發任何藥物,或者通過加密貨幣通證來償還他們的醫療處方。相關合約會被公開進行哈希處理,並將個人的同意書記錄在區塊鏈上。

基因組學的窘境

Nebula公司進行的一項調查發現,當人們被問及是否會考慮對他們的基因組進行測序時,隱私和倫理方面的問題遠遠超過了所有其他因素。在另一項對13000人進行的研究中,86%的人表示他們擔心自己的基因數據被濫用:超過一半的人表達了對隱私的擔憂。

今年4月,在Cambridge Analytica醜聞爆出後,有消息稱警探挖掘出了一個業餘愛好者的基因組數據庫,其中包含了一些個人DNA片段,他們希望這些片段能幫助破案。

在不知情的公眾上傳的集中存儲的基因材料中,執法部門沒有遇到任何阻力。當許多人通過DNA的糾纏歡呼金州殺手的逮捕時,其他人表達了相當的不安。

這種模糊的訪問權限具有超出了取證的意義。現如今人們擔心雇主和保險公司的基因歧視——後者目前只在法律上被部分禁止。

為基因組學帶來變革的匿名區塊鏈系統

在這個越來越不透明的基因組數據領域中,私人公司將消費者產生的基因型數據貨幣化,而序列數據則分散在專有的、中心化的系統中。

將基因組學引入區塊鏈將允許加速研究所需的時間,同時通過將匿名身份與加密標識分開來保護這種獨特的個人資訊。用戶仍然控制著他們的數據,並確切地決定與誰共享數據以及共享數據的目的。反過來,這種訪問將在一個可審計和不可變的分類帳本上被跟蹤。

區塊鏈可以去除醫療領域的病情錯報問題

據稱,23andMe存儲了大約500萬份基因型客戶資料,其競爭對手Ancestry.com存儲了約1000萬份。這些公司針對每一份個人資料會收集大約300個表現型數據,以此來了解你的健康情況和生活習慣。

表現型是個體的一組可觀察的特徵,這些特徵是個體的基因型與環境相互作用的結果。生成和共享對這些數據的訪問對於通過變異和特徵的相關性解碼基因組至關重要。但由於大部分表現型數據都來自於自我報告,現有數據的品質是不確定的。而錯誤的數據會影響醫療研究的效率和準確性。

區塊鏈系統可以提供獨特的機制來阻止欺騙的發生。如果發現某人試圖隱瞞自己的健康狀況,那麽他們的加密貨幣存款就會被扣留。

2018年:染色體和區塊鏈

考慮到人體基因組的數據強度,中心化記憶體是無法滿足哪怕是一小部分人的需求。

單個基因組的複雜原始數據集可達200GB。據報導,在2017年6月,美國國家衛生研究院的GenBank擁有超過兩兆鹼基的序列。鑒於基因組的數據龐大,這仍然需要先將其壓縮再寫入到區塊鏈上。而截止到2018年6月中旬,比特幣區塊鏈的平均交易額為423千字節。

比特幣區塊鏈的平均交易規模,2014-18。來源:TradeBlock.com

今年6月,DNAtix宣布首次使用區塊鏈技術傳輸了一條完整的染色體。Lidsky告訴Cointelegraph,公司已經成功地在今年8月實現了99%的DNA資訊壓縮率。

但即使在區塊鏈上,由於基因組學的獨特敏感性,數據傳輸也是不必要和不明智的。一些研究者建議共享數據訪問,該解決方案將區塊鏈與先進的加密技術和分布式計算方法相結合。

加密數據可以提供給所謂的基因組應用程式的開發者,它們還可以為研究人員和其他第三方開發者提供進一步的盈利來源。但是,將基因解釋外包給一個應用程式真的那麽簡單嗎?這種有著幾十年歷史的醫療模式讓患者去找遺傳顧問,讓他們檢查風險,討論病情預期,幫助他們解釋可能令人困惑、甚至是害怕的結果。

一些基因檢測公司已經被指責給他們的客戶留下了“大量數據和很少答案”的印象。“23andMe能解釋一系列‘健康’基因,它還能揭示你是否攜帶一種可能影響孩子未來健康的基因突變體,而且截至2017年,它甚至被授權披露包括乳腺癌和帕金森症在內的遺傳健康風險。”

Nebula和DNAtix都在考慮如何將遺傳谘詢師集成到他們的生態系統中,Grishin還提議用戶可以“選擇”是否真的想“知道基因組結果的一切”,或者僅僅想要“現代醫學能夠解決的病情”。

生物技術前沿

區塊鏈對基因組學的重要性逐漸顯現。既然我們細胞中的DNA被理解為資訊的終身存儲者,那麽就需要一種新的顛覆性技術來安全地、靈活地管理人體代碼的連鎖網絡。

基因組學的出現提出了僅靠科學無法解決的問題。對於我們所有的受訪者來說,區塊鏈可能是創造公平和透明的所有權和流通方式的關鍵,以確保這些原始的生物資訊載體不會被濫用。

獲得更多的PTT最新消息
按讚加入粉絲團