一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - 詳解基于python的全局與局部序列比對的實現(DNA)

詳解基于python的全局與局部序列比對的實現(DNA)

2020-10-07 21:40mmqwqf Python

這篇文章主要介紹了詳解基于python的全局與局部序列比對的實現(DNA).文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

程序能實現什么

a.完成gap值的自定義輸入以及兩條需比對序列的輸入
b.完成得分矩陣的計算及輸出
c.輸出序列比對結果
d.使用matplotlib對得分矩陣路徑的繪制

一、實現步驟

1.用戶輸入步驟

a.輸入自定義的gap值
b.輸入需要比對的堿基序列1(A,T,C,G)換行表示輸入完成
b.輸入需要比對的堿基序列2(A,T,C,G)換行表示輸入完成

輸入(示例):

詳解基于python的全局與局部序列比對的實現(DNA)

2.代碼實現步驟

1.獲取到用戶輸入的gap,s以及t
2.調用構建得分矩陣函數,得到得分矩陣以及方向矩陣
3.將得到的得分矩陣及方向矩陣作為參數傳到回溯函數中開始回溯得到路徑,路徑存儲使用的是全局變量,存的仍然是方向而不是坐標位置減少存儲開銷,根據全局變量中存儲的方向將比對結果輸出。
4.根據全局變量中存儲的方向使用matplotlib畫出路徑

全局比對代碼如下:

import matplotlib.pyplot as plt
import numpy as np

#定義全局變量列表finalList存儲最后回溯的路徑 finalOrder1,finalOrder2存儲最后的序列 finalRoad用于存儲方向路徑用于最后畫圖
def createList():
  global finalList
  global finalOrder1
  global finalOrder2
  global finalRoad
  finalList = []
  finalOrder1 = []
  finalOrder2 = []
  finalRoad = []


#創建A G C T 對應的鍵值對,方便查找計分矩陣中對應的得分
def createDic():
  dic = {'A':0,'G':1,'C':2,'T':3}
  return dic
#構建計分矩陣
# A G C T
def createGrade():
  grade = np.matrix([[10,-1,-3,-4],
            [-1,7,-5,-3],
            [-3,-5,9,0],
            [-4,-3,0,8]])
  return grade

#計算兩個字符的相似度得分函數
def getGrade(a,b):
  dic = createDic() # 堿基字典 方便查找計分矩陣
  grade = createGrade() # 打分矩陣grade
  return grade[dic[a],dic[b]]

#構建得分矩陣函數 參數為要比較序列、自定義的gap值
def createMark(s,t,gap):
  a = len(s)             #獲取序列長度a,b
  b = len(t)
  mark = np.zeros((a+1,b+1))     #初始化全零得分矩陣
  direction = np.zeros((a+1,b+1,3)) #direction矩陣用來存儲得分矩陣中得分來自的方向  第一個表示左方 第二個表示左上 第三個表示上方 1表示能往哪個方向去
                    #由于得分可能會來自多個方向,所以使用三維矩陣存儲

  direction[0][0] = -1        #確定回溯時的結束條件 即能夠走到方向矩陣的值為-1
  mark[0,:] = np.fromfunction(lambda x, y: gap * (x + y), (1, b + 1), dtype=int)   #根據gap值將得分矩陣第一行計算出
  mark[:,0] = np.fromfunction(lambda x, y: gap * (x + y), (1, a + 1), dtype=int)   #根據gap值將得分矩陣第一列計算出
  for i in range(1,b+1):
    direction[0,i,0] = 1
  for i in range(1, a + 1):
    direction[i, 0, 2] = 1

  for i in range(1,a+1):
    for j in range(1,b+1):
      threeMark = [mark[i][j-1],mark[i-1][j-1],mark[i-1][j]]     #threeMark表示現在所要計算得分的位置的左邊 左上 上邊的得分
      threeGrade = [gap,getGrade(s[i-1],t[j-1]),gap]         #threeGrade表示經過需要計算得左邊 左上 上邊的空位以及相似度得分
      finalGrade = np.add(threeMark,threeGrade)           #finalGrade表示最終來自三個方向上的得分
      mark[i][j] = max(finalGrade)                  #選取三個方向上的最大得分存入得分矩陣
      #可能該位置的得分可以由多個方向得來,所以進行判斷并循環賦值
      for k in range(0,len([y for y,x in enumerate(finalGrade) if x == max(finalGrade)])):
        directionList = [y for y,x in enumerate(finalGrade) if x == max(finalGrade)]
        direction[i][j][directionList[k]] = 1
  return mark,direction

#回溯函數 參數分別為 得分矩陣 方向矩陣 現在所處得分矩陣的位置 以及兩個序列
def remount(mark,direction,i,j,s,t):
  if direction[i][j][0] == 1 :
    if direction[i][j-1][0] == -1:      #如果該位置指向左邊 先判斷其左邊是否是零點
      finalList.append(0)          #如果是 將該路徑存入路徑列表
      finalList.reverse()          #將列表反過來得到從零點開始的路徑
      index1 = 0              #記錄現在所匹配序列s的位置 因為兩個字符串可能是不一樣長的
      index2 = 0              #記錄現在所匹配序列t的位置
      for k in finalList:
        if k == 0 :
          finalOrder1.append("-")
          finalOrder2.append(t[index2])
          index2 += 1
        if k == 1 :
          finalOrder1.append(s[index1])
          finalOrder2.append(t[index2])
          index1 += 1
          index2 += 1
        if k == 2 :
          finalOrder1.append(s[index1])
          finalOrder2.append("-")
          index1 += 1
      finalList.reverse() # 將原來反轉的路徑再返回來
      finalRoad.append(np.array(finalList)) # 將此次的路徑添加到最終路徑記錄用于最后畫圖
      finalList.pop()            #輸出后將當前方向彈出 并回溯
      return
    else :
      finalList.append(0)          #如果不是零點 則將該路徑加入路徑矩陣,繼續往下走
      remount(mark,direction,i,j-1,s,t)
      finalList.pop()            #該方向走完后將這個方向彈出 繼續下一輪判斷 下面兩個大的判斷同理
  if direction[i][j][1] == 1 :
    if direction[i-1][j-1][0] == -1:

      finalList.append(1)
      finalList.reverse()          # 將列表反過來得到從零點開始的路徑
      index1 = 0              # 記錄現在所匹配序列s的位置 因為兩個字符串可能是不一樣長的
      index2 = 0              # 記錄現在所匹配序列t的位置
      for k in finalList:
        if k == 0 :
          finalOrder1.append("-")
          finalOrder2.append(t[index2])
          index2 += 1
        if k == 1 :
          finalOrder1.append(s[index1])
          finalOrder2.append(t[index2])
          index1 += 1
          index2 += 1
        if k == 2 :
          finalOrder1.append(s[index1])
          finalOrder2.append("-")
          index1 += 1
      finalList.reverse() # 將原來反轉的路徑再返回來
      finalRoad.append(np.array(finalList)) # 將此次的路徑添加到最終路徑記錄用于最后畫圖
      finalList.pop()
      return
    else :
      finalList.append(1)
      remount(mark,direction,i-1,j-1,s,t)
      finalList.pop()
  if direction[i][j][2] == 1 :
    if direction[i-1][j][0] == -1:
      finalList.append(2)
      finalList.reverse()           # 將列表反過來得到從零點開始的路徑
      index1 = 0                # 記錄現在所匹配序列s的位置 因為兩個字符串可能是不一樣長的
      index2 = 0                # 記錄現在所匹配序列t的位置
      for k in finalList:
        if k == 0 :
          finalOrder1.append("-")
          finalOrder2.append(t[index2])
          index2 += 1
        if k == 1 :
          finalOrder1.append(s[index1])
          finalOrder2.append(t[index2])
          index1 += 1
          index2 += 1
        if k == 2 :
          finalOrder1.append(s[index1])
          finalOrder2.append("-")
          index1 += 1
      finalList.reverse()          # 將原來反轉的路徑再返回來
      finalRoad.append(np.array(finalList)) # 將此次的路徑添加到最終路徑記錄用于最后畫圖
      finalList.pop()
      return
    else :
      finalList.append(2)
      remount(mark,direction,i-1,j,s,t)
      finalList.pop()

#畫箭頭函數
def arrow(ax,sX,sY,aX,aY):
  ax.arrow(sX,sY,aX,aY,length_includes_head=True, head_width=0.15, head_length=0.25, fc='w', ec='b')

#畫圖函數
def drawArrow(mark, direction, a, b, s, t):
  #a是s的長度為4  b是t的長度為6
  fig = plt.figure()
  ax = fig.add_subplot(111)
  val_ls = range(a+2)
  scale_ls = range(b+2)
  index_ls = []
  index_lsy = []
  for i in range(a):
    if i == 0:
      index_lsy.append('#')
    index_lsy.append(s[a-i-1])
  index_lsy.append('0')
  for i in range(b):
    if i == 0:
      index_ls.append('#')
      index_ls.append('0')
    index_ls.append(t[i])
  plt.xticks(scale_ls, index_ls)      #設置坐標字
  plt.yticks(val_ls, index_lsy)
  for k in range(1,a+2):
    y = [k for i in range(0,b+1)]
    x = [x for x in range(1,b+2)]
    ax.scatter(x, y, c='y')
  for i in range(1,a+2):
    for j in range(1,b+2):
      ax.text(j,a+2-i,int(mark[i-1][j-1]))
  lX = b+1
  lY = 1
  for n in range(0,len(finalRoad)):
    for m in (finalRoad[n]):
      if m == 0:
        arrow(ax,lX,lY,-1,0)
        lX = lX - 1
      elif m == 1:
        arrow(ax,lX,lY,-1,1)
        lX = lX - 1
        lY = lY + 1
      elif m == 2:
        arrow(ax, lX, lY, 0, 1)
        lY = lY + 1
    lX = b + 1
    lY = 1
  ax.set_xlim(0, b + 2) # 設置圖形的范圍,默認為[0,1]
  ax.set_ylim(0, a + 2) # 設置圖形的范圍,默認為[0,1]
  ax.set_aspect('equal') # x軸和y軸等比例
  plt.show()
  plt.tight_layout()
if __name__ == '__main__':
  createList()
  print("Please enter gap:")
  gap = int(input())       #獲取gap值 轉換為整型  tip:剛開始就是因為這里沒有進行類型導致后面的計算部分報錯
  print("Please enter sequence 1:")
  s = input()           #獲取用戶輸入的第一條序列
  print("Please enter sequence 2:")
  t = input()           #獲取用戶輸入的第二條序列
  a = len(s)           #獲取s的長度
  b = len(t)           #獲取t的長度
  mark,direction = createMark(s,t,gap)
  print("The scoring matrix is as follows:")     #輸出得分矩陣
  print(mark)
  remount(mark,direction,a,b,s,t) #調用回溯函數
  c = a if a > b else b     #判斷有多少種比對結果得到最終比對序列的長度
  total = int(len(finalOrder1)/c)
  for i in range(1,total+1):   #循環輸出比對結果
    k = str(i)
    print("Sequence alignment results "+k+" is:")
    print(finalOrder1[(i-1)*c:i*c])
    print(finalOrder2[(i-1)*c:i*c])
  drawArrow(mark, direction, a, b, s, t)

局部比對代碼如下

import matplotlib.pyplot as plt
import numpy as np
import operator
#在局部比對中 回溯結束的條件是方向矩陣中該位置的值全為0
#定義全局變量列表finalList存儲最后回溯的路徑 finalOrder1,finalOrder2存儲最后的序列
def createList():
  global finalList
  global finalOrder1
  global finalOrder2
  global finalRoad
  finalList = []
  finalOrder1 = []
  finalOrder2 = []
  finalRoad = []


#創建A G C T 對應的鍵值對,方便查找計分矩陣中對應的得分
def createDic():
  dic = {'A':0,'G':1,'C':2,'T':3}
  return dic
#構建計分矩陣
# A G C T
def createGrade():
  grade = np.matrix([[10,-1,-3,-4],
            [-1,7,-5,-3],
            [-3,-5,9,0],
            [-4,-3,0,8]])
  return grade

#計算兩個字符的相似度得分函數
def getGrade(a,b):
  dic = createDic() # 堿基字典 方便查找計分矩陣
  grade = createGrade() # 打分矩陣grade
  return grade[dic[a],dic[b]]

#構建得分矩陣函數 參數為要比較序列、自定義的gap值
def createMark(s,t,gap):
  a = len(s)             #獲取序列長度a,b
  b = len(t)
  mark = np.zeros((a+1,b+1))     #初始化全零得分矩陣
  direction = np.zeros((a+1,b+1,3)) #direction矩陣用來存儲得分矩陣中得分來自的方向  第一個表示左方 第二個表示左上 第三個表示上方 1表示能往哪個方向去
                    #由于得分可能會來自多個方向,所以使用三維矩陣存
  for i in range(1,a+1):
    for j in range(1,b+1):
      threeMark = [mark[i][j-1],mark[i-1][j-1],mark[i-1][j]]     #threeMark表示現在所要計算得分的位置的左邊 左上 上邊的得分
      threeGrade = [gap,getGrade(s[i-1],t[j-1]),gap]         #threeGrade表示經過需要計算得左邊 左上 上邊的空位以及相似度得分
      finalGrade = np.add(threeMark,threeGrade)           #finalGrade表示最終來自三個方向上的得分
      if max(finalGrade) >= 0:                  #如果該最大值是大于0的則 選取三個方向上的最大得分存入得分矩陣 否則不對矩陣進行修改
        mark[i][j] = max(finalGrade)
        for k in range(0,len([y for y,x in enumerate(finalGrade) if x == max(finalGrade)])): #可能該位置的得分可以由多個方向得來,所以進行判斷并循環賦值
          directionList = [y for y,x in enumerate(finalGrade) if x == max(finalGrade)]
          direction[i][j][directionList[k]] = 1
  return mark,direction

#回溯函數 參數分別為 得分矩陣 方向矩陣 現在所處得分矩陣的位置 以及兩個序列
def remount(mark,direction,i,j,s,t):
  if direction[i][j][0] == 1 :
    if all(direction[i][j-1] == [0,0,0]):      #如果該位置指向左邊 先判斷其左邊是否是零點
      finalList.append(0)          #如果是 將該路徑存入路徑列表
      finalList.reverse()          #將列表反過來得到從零點開始的路徑
      index1 = i              #記錄現在所匹配序列s的位置 因為兩個字符串可能是不一樣長的
      index2 = j-1              #記錄現在所匹配序列t的位置
      for k in finalList:
        if k == 0 :
          finalOrder1.append("-")
          finalOrder2.append(t[index2])
          index2 += 1
        if k == 1 :
          finalOrder1.append(s[index1])
          finalOrder2.append(t[index2])
          index1 += 1
          index2 += 1
        if k == 2 :
          finalOrder1.append(s[index1])
          finalOrder2.append("-")
          index1 += 1
      finalList.reverse()
      finalRoad.append(np.array(finalList)) # 將此次的路徑添加到最終路徑記錄用于最后畫圖
      finalList.pop()            #輸出后將當前方向彈出 并回溯
      return
    else :
      finalList.append(0)          #如果不是零點 則將該路徑加入路徑矩陣,繼續往下走
      remount(mark,direction,i,j-1,s,t)
      finalList.pop()            #該方向走完后將這個方向彈出 繼續下一輪判斷 下面兩個大的判斷同理
  if direction[i][j][1] == 1 :
    if all(direction[i-1][j-1] == [0,0,0]):
      finalList.append(1)
      finalList.reverse()           # 將列表反過來得到從零點開始的路徑
      index1 = i-1              # 記錄現在所匹配序列s的位置 因為兩個字符串可能是不一樣長的
      index2 = j-1              # 記錄現在所匹配序列t的位置
      for k in finalList:
        if k == 0 :
          finalOrder1.append("-")
          finalOrder2.append(t[index2])
          index2 += 1
        if k == 1 :
          finalOrder1.append(s[index1])
          finalOrder2.append(t[index2])
          index1 += 1
          index2 += 1
        if k == 2 :
          finalOrder1.append(s[index1])
          finalOrder2.append("-")
          index1 += 1
      finalList.reverse()
      finalRoad.append(np.array(finalList)) # 將此次的路徑添加到最終路徑記錄用于最后畫圖
      finalList.pop()
      return
    else :
      finalList.append(1)
      remount(mark,direction,i-1,j-1,s,t)
      finalList.pop()
  if direction[i][j][2] == 1 :
    if all(direction[i-1][j] == [0,0,0]):
      finalList.append(2)
      finalList.reverse()           # 將列表反過來得到從零點開始的路徑
      index1 = i-1                # 記錄現在所匹配序列s的位置 因為兩個字符串可能是不一樣長的
      index2 = j                # 記錄現在所匹配序列t的位置
      for k in finalList:
        if k == 0 :
          finalOrder1.append("-")
          finalOrder2.append(t[index2])
          index2 += 1
        if k == 1 :
          finalOrder1.append(s[index1])
          finalOrder2.append(t[index2])
          index1 += 1
          index2 += 1
        if k == 2 :
          finalOrder1.append(s[index1])
          finalOrder2.append("-")
          index1 += 1
      finalList.reverse()
      finalRoad.append(np.array(finalList)) # 將此次的路徑添加到最終路徑記錄用于最后畫圖
      finalList.pop()
      return
    else :
      finalList.append(2)
      remount(mark,direction,i-1,j,s,t)
      finalList.pop()
#畫箭頭函數
def arrow(ax,sX,sY,aX,aY):
  ax.arrow(sX,sY,aX,aY,length_includes_head=True, head_width=0.15, head_length=0.25, fc='w', ec='b')

#畫圖函數
def drawArrow(mark, direction, a, b, s, t,mx,my):
  #a是s的長度為4  b是t的長度為6
  fig = plt.figure()
  ax = fig.add_subplot(111)
  val_ls = range(a+2)
  scale_ls = range(b+2)
  index_ls = []
  index_lsy = []
  for i in range(a):
    if i == 0:
      index_lsy.append('#')
    index_lsy.append(s[a-i-1])
  index_lsy.append('0')
  for i in range(b):
    if i == 0:
      index_ls.append('#')
      index_ls.append('0')
    index_ls.append(t[i])
  plt.xticks(scale_ls, index_ls)      #設置坐標字
  plt.yticks(val_ls, index_lsy)
  for k in range(1,a+2):
    y = [k for i in range(0,b+1)]
    x = [x for x in range(1,b+2)]
    ax.scatter(x, y, c='y')
  for i in range(1,a+2):
    for j in range(1,b+2):
      ax.text(j,a+2-i,int(mark[i-1][j-1]))
  lX = my + 1
  lY = a - mx + 1
  for n in range(0,len(finalRoad)):
    for m in (finalRoad[n]):
      if m == 0:
        arrow(ax,lX,lY,-1,0)
        lX = lX - 1
      elif m == 1:
        arrow(ax,lX,lY,-1,1)
        lX = lX - 1
        lY = lY + 1
      elif m == 2:
        arrow(ax, lX, lY, 0, 1)
        lY = lY + 1
    lX = b + 1
    lY = 1
  ax.set_xlim(0, b + 2) # 設置圖形的范圍,默認為[0,1]
  ax.set_ylim(0, a + 2) # 設置圖形的范圍,默認為[0,1]
  ax.set_aspect('equal') # x軸和y軸等比例
  plt.show()
  plt.tight_layout()

if __name__ == '__main__':
  createList()
  print("Please enter gap:")
  gap = int(input())       #獲取gap值 轉換為整型  tip:剛開始就是因為這里沒有進行類型導致后面的計算部分報錯
  print("Please enter sequence 1:")
  s = input()           #獲取用戶輸入的第一條序列
  print("Please enter sequence 2:")
  t = input()           #獲取用戶輸入的第二條序列
  a = len(s)           #獲取s的長度
  b = len(t)           #獲取t的長度
  mark,direction = createMark(s,t,gap)
  print("The scoring matrix is as follows:")     #輸出得分矩陣
  print(mark)
  maxDirection = np.argmax(mark) #獲取最大值的位置
  i = int(maxDirection/(b+1))
  j = int(maxDirection - i*(b+1))
  remount(mark,direction,i,j,s,t) #調用回溯函數
  print(finalOrder1)
  print(finalOrder2)
  drawArrow(mark, direction, a, b, s, t, i, j)

二、實驗結果截圖

1.全局比對

詳解基于python的全局與局部序列比對的實現(DNA)

詳解基于python的全局與局部序列比對的實現(DNA)

詳解基于python的全局與局部序列比對的實現(DNA)

2.局部比對

詳解基于python的全局與局部序列比對的實現(DNA)

詳解基于python的全局與局部序列比對的實現(DNA)

詳解基于python的全局與局部序列比對的實現(DNA)

到此這篇關于詳解基于python的全局與局部序列比對的實現(DNA)的文章就介紹到這了,更多相關python全局與局部序列比對內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!


總結

本次實驗使用動態規劃對全局序列比對進行了實現,自己卡的最久的地方是回溯以及畫圖的時候。剛開始在實現回溯的過程中,老是找不準回溯的條件以及將所有的路徑都記錄下來的方法,最后是使用的方向矩陣,也就是重新定義一個與得分矩陣等大的矩陣(但是這個矩陣是三維),存放的是每個位置能夠回溯的方向,第一個數值表示左邊,第二個表示左上,第三個表示上方,為0時表示當前方向不能回溯,沒有路徑,為1時表示能回溯,當該位置的所有能走的方向都走完時即可返回。將所有路徑記錄下來的方法是定義全局變量,當有路徑能夠走到終點時便將這條路徑存放入該全局變量中。
繪圖的時候使用的是matplotlib中的散點圖,然后將每個點的得分以注釋的形式標記在該點的右上角,并用箭頭將路徑繪出。不得不說的是,這個圖確實太丑了,我學識淺薄,也沒想到能畫出這個圖的更好的方法,還希望老師指點。
總的來說這次實驗經歷的時間還比較長,主要是因為python也沒有很熟悉,很多函數也是查了才知道,然后可視化更是了解的少,所以畫出來的圖出奇的丑,還有回溯的時候也是腦子轉不過彎來,所以要學習的東西還有很多,需要更加努力。
本次實驗還能夠有所改進的地方是:
1.把兩個比對算法結合,讓用戶能夠選擇使用哪種比對方式。
2.作出一個更好看的界面,增加用戶體驗感。
3.把圖畫的更美觀。
(老丁已閱,USC的同學們謹慎借鑒)

原文鏈接:https://blog.csdn.net/mmqwqf/article/details/108922579

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 日日艹 | 国产精品久久久久久久久久久久久久 | 单亲乱l仑在线观看免费观看 | 免费观看在线aa | 欧美日韩国产亚洲一区二区 | 日本动漫打扑克动画片樱花动漫 | 日本一区二区三区在线 观看网站 | 国产一区二区不卡视频 | 日本中文字幕在线观看视频 | 亚洲欧美国产另类 | 男人天堂视频网 | 国产综合久久久久久 | 嫩交18xxxx| 国产精品久久久久久久久久久久 | 色综合天天网 | 国产精品免费_区二区三区观看 | 91av免费在线观看 | 丝瓜黄瓜茄子西红柿秋葵榴莲 | 公园吃女人奶野战视频 | 性派对videos18party | 久久毛片免费看一区二区三区 | 国产手机在线αⅴ片无码观看 | 亚洲 日韩 国产 中文视频 | 日韩视频免费一区二区三区 | 92国产福利视频一区二区 | 糖心在线观看 | 欧美亚洲另类综合 | 日韩精品高清自在线 | 美女的让男人桶爽网站 | 精品国产乱码久久久久久人妻 | 3d动漫美女被吸乳羞羞有 | 亚洲 制服 欧美 中文字幕 | 日韩免费毛片视频杨思敏 | 火影小南被爆羞羞网站进入 | 91影视永久福利免费观看 | 国产美女屁股直流白浆视频无遮挡 | 国产一区二区在线免费观看 | 九9热这里只有真品 | 我与么公激情性完整视频 | 亚洲天堂影院在线观看 | 久久久精品国产免费A片胖妇女 |