본문 바로가기
Project/Molecular dynamics and Biology

10. Note 2[Characteristics study of TATA box through comparison of elastic modulus according to DNA sequence]

by sonpang 2021. 11. 12.
반응형

inp 파일은 원자들간의 퍼텐셜을 정의한 파일로 보통은 수정할 필요가 없음. 자신이 새로운 분자를 생성하고, 기존의 원자-원자간 퍼텐셜을 새롭게 정의할 필요가 있을 때는 수정을 해야됨.

 

dna 의 경우 parameter 파일과 topology 파일에 na(nucleic acids) 가 들어가 있는 파일을 쓰면 됨.

dna 를 protein data bank 에서 pdb로 가져와서 water box 에 넣고 시뮬레이션 하면 될 것 같다.

 

namd로 simulation을 시도하였으나 계속 실패. 

conf파일을 수정하여 시도하였으나 마지막으로 수정하지 못한 파일의 오류는 parameter 파일인 것 같다.

 

에러메세지를 보면 angle parameter 가 없다는 것인데, 최신 파라미터 파일이 필요할지 모른다.

 

파라미터 파일을 지정할 때, 여러가지 파라미터 파일을 함께 사용해도 된다.

lipid 또는 protein 에 해당하는 파일이 필요

http://mackerell.umaryland.edu/charmm_ff.shtml

 

MacKerell Lab

Proteins C36m Protein Huang, J., Rauscher, S., Nawrocki, G., Ran, T., Feig, M, de Groot, B.L., Grubmuller, H., and MacKerell, A.D., Jr., "CHARMM36m: An Improved Force Field for Folded and Intrinsically Disordered Proteins," Nature Methods, 14:71-73, 2016,

mackerell.umaryland.edu

 

TCL: Minimizing for 100 steps

FATAL ERROR: Memory allocation failed on processor 0.

------------- Processor 0 Exiting: Called CmiAbort ------------

Reason: FATAL ERROR: Memory allocation failed on processor 0.

 

Charm++ fatal error:

FATAL ERROR: Memory allocation failed on processor 0.

 

예상시간 도출

unix 라면 grep days *.log 로 볼수 있을텐데  윈도우 터미널에서는 안 된다.

 

 

log 파일을 열어보면 sec/step  또는  days/ns 1 스텝당 몇초 걸리는지 알면  여기에   스텝수를 곱해 계산하면 된다.

아니면 몇 ns 시뮬레이션인지 알면 마찬가지로 몇 일 걸리는지 알수 있다.

 

days/ns는 확인해 본 결과 계산중간 결과마다 값이 차이가 많이 나서 오차가 많이 날것으로 생각하였다.

 

현재 진행중인 파일의 예상시간을 계산한 결과 40일 정도로 예상된다.

시뮬레이션 속도를 빠르게 할 수 있는 방법이나 water box의 크기를 줄이는 등의 방법을 모색해보아야 할 것 같다.

 

http://www.ks.uiuc.edu/Research/namd/wiki/?NamdMemoryReduction 에 제시된 방법을 시도해보고 있다.

step2까지는 진행이 완료된 상태인데, step2와 3을 conf파일에서 동시에 작업을 하여 simulation하는 것 같은데 계속 실패중이다.

 

MD 시뮬레이션을 할 때 항상 시스템을 중성화 시켜야 된다.

dna 의 경우 전하를 띠고 있어서, 먼저 해야될 작업이 VMD 에서 이온을 첨가해서 중성화를 시키는 일이다.

 

linux 버전에서는 계속 에러가 나서 이전 파라미터들로 다 바꾸어 놓았다.

 

파일 크기를 생각해서 시뮬레이션당 프레임수를 500정도로 한정했다.

 

마지막으로 tcl 파일은 시뮬레이션 결과를 vmd 상에서 볼 때 dna를 박스 중앙에 고정시키는 스크립트로 vmd tk 콘솔에서 source wrap.tcl라고 타입하면 된다.

 

다시 conf file을 확인한 결과 pressure control이 꺼져 있다는 사실을 알았다. 1차 Simulation과 2차Simulation의 결과가 서로 상반되게 도출되어 현재 matlab code나 simulation에 오류가 없었는지 확인하고 있다.

bubble이 생겼을 경우 지속길이가 작게 나오는 경향이 있습니다.(1차 Simulation의 결과는 예상하는 결과와 같게 나왔다.)

 

configuration 파일에 보니 pressure control 이 꺼져 있는데, 처음에는 pressure control 를 켜고 우리가 알고 있는 물의 밀도와 비슷하도록 water box 를 조정하는 작업이 필요하다.

 

대부분의 시뮬레이션에서 양쪽 끝부분이 조금 풀어지는데, 계산을 할 때 양쪽 끝 부분에서 나온 계산값은 제외할 것이다.

 

 

helix에서는 1turn당 몇 개의 carbon이 있는지 고려하여 slice를 형성하였다.

하지만 DNA와 같은 경우 1turn당 10개의 염기가 필요하기 때문에 helix와 같이 1turn을 고려하지 않는다.

 

(흥미로운 질문)helix에서 1turn당 몇개의 carbon이 있는지 고려하는 것이 물리적 모델에 필수적인 사항인지 check가 필요하다.

 

정확하게 기억은 안나지만 alpha-helix 의 경우 i 번째 아미노산과 i+4 아미노산이 수소 결합을 이루고 있는 형태라서 하나의 turn 을 주기로 슬라이스를 형성한 것으로 생각한다.

dna 의 경우도 수소결합이 어떻게 이루어져 있는냐에 따라서 몇개씩 묶을지 결정이 될것 같다.

 

 

현재 5ns 500000frame으로 simulation하고 있다.

 

dna 의 경우는 수소결합이 위, 아래가 아니라 옆으로 나란한 형태이므로, 슬라이스를 매 염기서열마다 잡을 때와 몇개 건너 띈 형태로 잡을 때의 bending modulus 가 달라지는지 한번 확인할 필요가 있다. 프레넷 식은 단순히 좌표계간의 성질을 보여주는 것이라서 좌표계를 어떻게 설정하는냐에 따라서 값의 변화가 다르겠지만, 계산된 물리량은 이런 mapping 과정에 무관하게 나오는 것이 맞을것 같다.

 

dna의 경우 상보적인 염기사이에 수소결합이 있다. 즉 각각의 가닥에는 수소결합이 존재하지 않지만 가닥과 가닥사이에 수소결합이 있어 이중나선구조 형태를 띄게 되는것으로 알고 있다. 그런데 수소결합에 따른 slice형성이 단순히 simulation결과를 반영하기 위해서인지 아니면 물리적모델링 과정중 필요한 내용인지는 의문이다.

반응형

댓글