亚洲午夜久久久久久91,欧美成人午夜免费完成,国产真实伦对白视频全集

并行計算

并行計算：簡單來講，就是同時使用多個計算資源來解決一個計算問題，是提高計算機系統計算速度和處理能力的一種有效手段。（參考：并行計算簡介）

一個問題被分解成為一系列可以并發執行的離散部分；
每個部分可以進一步被分解成為一系列離散指令；
來自每個部分的指令可以在不同的處理器上被同時執行；
需要一個總體的控制/協作機制來負責對不同部分的執行情況進行調度。

而在我們平時的模擬中，在一臺電腦或者服務器上，就是將我們的計算任務分散到多個不同的小的核中同時進行處理。

在模擬時什么地方可以用到并行？

并行操作一般適用于重復的操作，比如重復隨機按照相同分布生成數據，然后分別同時進行模擬。這里就可以用并行。亦或者我們要做permutation計算p-value等信息，也可以進行并行，因為這種操作是簡單的重復即可完成。

但諸如迭代，遞歸等算法就很難用并行實現，這種都叫串行。因為后一個的對象需要前一個對象的信息，只能先算完前一個，再計算后一個內容。

在進行實際的模擬比較多種方法的優劣時，通常需要重復實驗成百上千次，一般可對這里進行并行操作，寫在這里的操作是最簡單的。但會有個缺點：可能會出現掛服務器跑了半天還沒出現結果，但是自己又并不知道運行到哪了的現象。雖然有一些方法可以進行查看（例如snowfall中的sfCat()函數，但是輸出的結果是相對來說比較凌亂的，而且有時還會輸出不了，具體用法后面會進行介紹），但是還是可能等很久才出一些結果，如果并行某一個地方維度或者代碼有些小瑕疵，整段結果都沒法進行輸出。

所以建議，如果能將并行寫到每個算法中間的話，就盡量寫到每個具體算法之中（如需要permutation的寫到permutation中；如要多次for循環計算統計量以及其它信息的，直接替代for循環），這樣后面實際操作時也比較方便。（這樣做的缺點是可能導致內存占用過多，從而使并行出錯）

怎么在R中看我們可以使用并行？

只需使用如下命令，就可以查看我們電腦能夠使用的線程數：

1	`detectCores()`

理論上這個值 ≥2，我們電腦就可以進行并行操作（現在的電腦基本都是4往上的）。當然通常我們不會使用所有的線程來進行并行，不然。。。電腦很可能會崩。

言歸正傳，下面介紹兩種R中常用的并行操作（默認會apply族相關操作）。

parallel（簡單）

一個是parallel包，此包最大的優勢就是非常的便捷，只需將我們原本的apply()修改為parApply()；lapply()修改為parLapply()；sapply()修改為我們常用的parSapply()等等，然后再在開頭和結尾添加上相應的開始并行與結束并行的語句即可。

下面舉個栗子（參考：How-to go parallel in R – basics + tips）

首先我們使用lapply()進行下述操作向量化操作：

1	`lapply(1:3, function(x) c(x, x ^` `2, x ^` `3))`

輸出結果為：

[[1]]
[1] 1 1 1

[[2]]
[1] 2 4 8

[[3]]
[1] 3 9 27

我們將其修改為并行方法，首先是初始化我們的并行：

									library(parallel) # 載入parallel包

									# 計算可用線程數，并設置并行使用線程數

									no_cores <- detectCores() - 1

									# 初始化

									cl <- makeCluster(no_cores)