垃圾DNA的新發現會讓人吃驚!

來源 : http://www.gewo.applet.cz/health/DNA_1e.htm

翻譯:蕭光航

原文:http://hi.baidu.com/james1/blog/item/3907f4002cbe188ee950cdf1.html


一個致力於人類基因工程的研究小組很快將要宣布一項讓人震驚的科學發現:他們相信在人類的DNA中存在的所謂“非代碼”基因序列(97%)即是一種地外生物形態的遺傳代碼。
黴菌到魚類到人類,這組非代碼基因序列在所有地球生物組織中皆常可見。 小組組長Sam Chang教授說,在人類的DNA中,它們(非代碼基因)在總的基因數中佔有更大的比例。

非代碼基因又稱作“垃圾DNA”,多年前即被發現,它們的功能仍然是個迷。 它們不像正常的基因那樣載有合成蛋白、酶及其他人體產生的化學物的信息,非代碼基因序列沒有任何使用目的。 它們不作表述,就是說它們承載的信息無法讀取,也沒有合成物質,它們根本沒有任何功能。 我們存在於我們3%的DNA之中。 垃圾DNA只是喜歡搭在活躍的功能性基因上面,一代代地往下傳承。 它們是什麼? 為什麼這些閒置的基因會在我們的基因組裡? 這些問題不斷地被科學家們提出來,卻無法找到答案--現在終於被Sam Chang教授和他的小組取得了突破。

要想明白垃圾DNA的起源及意義,Chang教授覺得他首先需要一個對“垃圾”的定義。 是否垃圾DNA真的就是垃圾(無用且無意義的),或者由於某種原因它包含了其他DNA所不具有的信息? 他的熟友Lipshutz博士是位年輕的理論物理學家,現在轉行在華爾街搞衍生證券,他跟他提到了這個問題。

“這好辦”Lipshutz說“我把你的基因序列用我那個市場數據分析軟件分析一下,馬上就知道你的那些序列是完全的垃圾,還是'白噪值(空值)'或者裡頭有什麼信息。”

Lipshutz在晚上及週末進行測試,他得以證實了非代碼序列並不全是垃圾,它們是有承載信息的

“讓我感到驚訝的是,代碼與非代碼的熵差距沒有那麼大”,Lipshutz說,“兩者都有空值,但絕不是垃圾。如果市場信息能像這樣整齊,我可能早得退休了。”

最後Chang教授找到了Adnan Mussaelian博士,他是前蘇聯共和國的天才編碼破譯員。 可憐的傢伙現在靠一個月15塊美金的工資苟活,偶爾也給富家子弟上課賺點外塊。 對他來說有一萬美金的研究經費是走了財運,他像一隻勤奮的海狸,開始賣力地工作。

Adnan很快肯定了前面那位華爾街伙計的發現:代碼的熵顯示出的信息幾乎是清晰的,這不是什麼複雜的加密系統,不像是很難解決的問題。Adnan開始進行差異性密碼分析及執行相關的標準密碼分析技術。

他在這個項目上花了兩個月時間,這時他注意到所有非代碼序列都以一段短的DNA序列開頭,而在這些垃圾代碼的結尾也有類似的代碼。 這些部分,生物學家都知道是ALU序列,其遍布於整個人類基因組之中。 作為非代碼、垃圾序列本身,Alu序列是所有基因中最常見的。

Adnan受過的是密碼破譯員及電腦程序員的訓練,他沒有任何的微生物學知識,他把基因代碼當作電腦程序代碼來研究。 在試著類推分析時Adnan將源碼放入短序列符號統計程序中進行分析,這個分析工作常用來破解信息。 最常見的符號是什麼? 當然,它是“/”號,這是一個註釋的符號! 在Pascal語言裡,這個符號是{和}! 當然,在C語言裡,在兩個斜杠之間的代碼永遠不會被執行,也是永遠沒有要被執行的意思;它不是代碼,它是代碼的註釋!

無法抵擋的誘惑使Adnan更進一步地進行類推,他開始比較電腦程序註釋與基因代碼之間的統計性狀的區別。 這裡頭肯定有很大的不同。 在統計的結果中應該會顯現出來。 然而,垃圾DNA與活躍的代碼序列沒有什麼不同。 為了確定一下,Adnan在分析中加了一個程序:驚異的是,代碼與註釋的統計結果幾乎是一樣的。 他檢查了一下源代碼,明白了原由:在斜杠之間只有很少的註釋,將其排除在執行之外,這與C語言碼的程序員通常的做法差不多。
Adnan是一個有宗教傾向的人,他想到了神的創造之手---但是當分析了序列內部的編碼之後,他覺得這段編碼不管是誰寫的,這肯定不是出於上帝之手。 這些人類基因的小段有效代碼寫得不是很工整,編寫得相當隨意,就像微軟某個人寫的一樣。 只不過寫基因代碼時,地球上微軟還沒出世呢。

地球上? 這想法就像一道閃電劃過...是不是這些基因碼是地外文明的編寫者為所有生命形式所編寫,然後就以某種方式存放在這裡,以備執行? 這種想法真是又瘋狂又怕人,Adnan一連幾天使勁讓自己別這麼想。 然後他決定繼續。 如果非代碼序列是程序的一部分,且被作者放棄或丟棄,有一個方法可以使它們執行。 唯一要做的就是將註釋的符號去掉。 如果在/*......*/中間的部分是有意義的,它將會被編譯並執行! 他選擇了最類似基因的200組非代碼序列,將它們類似/*,*/的去掉,猶豫了幾天后他發郵件給他的美國老闆,叫他想辦法將這組基因植入螺旋桿菌或其他的宿主,以便使代碼運行起來。

多年來生物學家一直試著解釋這些垃圾序列意義,但沒有多少進展。 有時是無功而返,有時得出來的又仍然是垃圾。 這個毫不奇怪。 隨手抓一把被隔離的電腦代碼,然後又要把它編譯出來。 這當然會失敗。 最多它只能得出一些奇怪的結果。 仔細分析代碼,從整個註釋中摸索出其功能,你還說不定能讓其運行起來。Mussaelian選了200組序列進行了一番細緻的統計分析後,從中又選了4個,開始著手研究,結果產生了少量的化學合成物質。


引用http://hi.baidu.com/theartoflove/blog/item/a919b51e97445cf8e1fe0b17.html
arrow
arrow
    全站熱搜

    peiying676 發表在 痞客邦 留言(0) 人氣()