怎么计算基因扩增长度(用Excel计算DNA中基因的ATACG对应序列编号小技巧)
有个同学问,他表格中有一条DNA,其中一条的碱基序列,如ATTAGACC....如何快速将它的另外一条序列计算出来呢?
那首先我们要拿起初中生物学的关于基因的知识,两个序列是一一对应的,对应关系是A-T,C-G,也就是说,ATTAGACC...,对应的碱基序列应该是TAATCTGG...
这是在基因中的正好对应,碰到这种类似的经典问题,那如何在Excel中快速的计算?大家集思广益,小编这里提供两种解决思路的方法。
第一种思路,先分列,再合并
❶在B2单元格中输入公式:=MID($A$1,COLUMN(A1),1),向右填充,直至每一个字母占据一个单元格,如下所示:
❷然后我们用IF函数进行判断,
在D2单元格中输入=IF(B1="A","T",IF(B1="T","A",IF(B1="C","G","C"))),然后向右填充,如下所示:
❸复制B2至W2的内容,粘贴为数值,将公式去除掉
❹然后在B2单元格中输入公式:=PHONETIC(B2:W2)
第2种思路,查找替换法
❶将序列中的A碱基替换成数字Z,使用公式:=SUBSTITUTE(A1,"A","Z")
❷然后将所有的T换成A,在前面的公式中再嵌套一个查找替换公式:=SUBSTITUTE(SUBSTITUTE(A1,"A","Z"),"T","A")
❸然后将所有的Z换成T,在前面公式再嵌套一个
=SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(A1,"A","Z"),"T","A"),"Z","T")
通过这三轮的转换把A和T已经进行了互换,用同样的方法将C和G进行互换
❹然后将所有的C替换成N,将所有的G替换成C,将所有的N替换成G即可完成,整体公式为:
=SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(A1,"A","Z"),"T","A"),"Z","T"),"C","N"),"G","C"),"N","G")
本节完,关键是对于思路的理解,公式的其它技巧是用来辅助思路完成的
给坚持学习的自己点个赞和分享吧
----------------------
欢迎关注,更多精彩内容持续更新中....
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com