在 juju 中使用 openmpi 運行八度音程時出現問題

在 juju 中使用 openmpi 運行八度音程時出現問題

我正在嘗試使用 Octave 中的 openmpi 來啟動遠端電腦上的其他 Octave 實例。當我運行應該啟動各個進程的腳本時,它抱怨庫已過期:

Running octave in parallel on /opt/data/octave/test using 24 processors
[pleasant-increase:13959] Warning: could not find environment variable "LD_PRELOAD"
[octave-controller:15259] mca: base: component_find: unable to open /usr/lib/openmpi/lib/openmpi/mca_paffinity_hwloc: perhaps a missing symbol, or compiled for a different ver$
[octave-controller:15259] mca: base: component_find: unable to open /usr/lib/openmpi/lib/openmpi/mca_carto_auto_detect: perhaps a missing symbol, or compiled for a different v$
[octave-controller:15259] mca: base: component_find: unable to open /usr/lib/openmpi/lib/openmpi/mca_carto_file: perhaps a missing symbol, or compiled for a different version $
[octave-controller:15259] mca: base: component_find: unable to open /usr/lib/openmpi/lib/openmpi/mca_shmem_mmap: perhaps a missing symbol, or compiled for a different version $
[octave-controller:15259] mca: base: component_find: unable to open /usr/lib/openmpi/lib/openmpi/mca_shmem_posix: perhaps a missing symbol, or compiled for a different version$
[octave-controller:15259] mca: base: component_find: unable to open /usr/lib/openmpi/lib/openmpi/mca_shmem_sysv: perhaps a missing symbol, or compiled for a different version $
--------------------------------------------------------------------------
It looks like opal_init failed for some reason; your parallel process is
likely to abort.  There are many reasons that a parallel process can
fail during opal_init; some of which are due to configuration or
environment problems.  This failure appears to be an internal failure;
here's some additional information (which may only be relevant to an
Open MPI developer):

  opal_shmem_base_select failed
  --> Returned value -1 instead of OPAL_SUCCESS
--------------------------------------------------------------------------
[octave-controller:15259] [[INVALID],INVALID] ORTE_ERROR_LOG: Error in file runtime/orte_init.c at line 79
--------------------------------------------------------------------------
It looks like MPI_INIT failed for some reason; your parallel process is
likely to abort.  There are many reasons that a parallel process can
fail during MPI_INIT; some of which are due to configuration or environment
problems.  This failure appears to be an internal failure; here's some
additional information (which may only be relevant to an Open MPI
developer):

  ompi_mpi_init: orte_init failed
  --> Returned "Error" (-1) instead of "Success" (0)
--------------------------------------------------------------------------
*** An error occurred in MPI_Init
*** on a NULL communicator
*** MPI_ERRORS_ARE_FATAL: your MPI job will now abort

它在各種進程中延續了這一點,有些函式庫有所不同,但始終具有

opal_shmem_base_select failed
...
ompi_mpi_init: orte_init failed

我看到評論說更改 openmpi 上的編譯標誌並重新編譯。

問題是我使用本機 juju 儲存庫來配置機器,我無法弄清楚將庫放在哪裡,以便在配置發生時載入它們,而不是 juju 目前使用的版本。我知道這些包被存放在某個地方。我不確定它們是否在 juju 狀態機、juju 伺服器上,或者 juju 是否充當它自己的 apt-get 直通通道。

任何想法表示讚賞。

新增了2015.04.28 1723PST-響應Robie Basak---------------------------------------- ------------ ------------

謝謝你的賞金,豪爾赫·卡斯特羅

我的集群未連接到網路。 MaaS 控制器目前已連接,但將來會斷開連接。當我設定 juju 時,我使用了本機儲存庫,如下所示

juju sync-tools -e maas --local-dir="~/.juju/sync-tools"
juju bootstrap -e mass --debug --upload-tools=true --metadata-source="~/.juju/sync-tools" --to jujuBS.maas
juju deploy --repository=".juju/charms" local:juju-gui --to 0
juju expose juju-gui

我對八度音程和八度音程控制器魅​​力使用了相同的機制。當我查看其中一個節點上 /var/log/juju 中的單元....log 檔案時,我看到許多 apt 正在載入。這些儲存在某個地方,因為節點無法存取網路。

其中一些是作為超級按鈕加載的結果而加載的,因此看來 MaaS 或 juju 都認識到超級按鈕的適當要求。我在魅力和安裝中添加了一些八度包,以便八度安裝它們,突然間缺少了必需的apt。這些 apt 顯然是 Octave 套件所必需的(事實證明,open-mpi 就是其中之一)。我下載了它,將其添加到超級按鈕並安裝。現在,MPI 套件以倍頻程加載,但給出了您在上面看到的狀態。

答案1

簡短的回答:一切盡在您的掌控之中;你可以在魅力的install鉤子上做你喜歡做的事。預設使用主 Ubuntu 存檔,並使用 MAAS 的 squid-deb-proxy 作為代理快取;沒有單獨的鏡像或儲存庫處於活動狀態。

MaaS 控制器目前已連接,但將來會斷開連接。

我認為您正在使用 MAAS 提供的 squid-deb-proxy,它會緩存包,但僅此而已。預設情況下,這表示您的 charm 安裝掛鉤看到的環境易於配置為使用 MAAS 提供的魷魚-deb-proxy 來下載軟體包,但sources.list仍指向主 Ubuntu 存檔。因此,您的軟體包來自 Ubuntu 存檔,透過 MAAS 作為軟體包快取。

要安排使用自訂套件,您需要install先透過重新配置 apt 來修改您的 charms 掛鉤以使用它。例如,您可以使用修改後的套件設定 PPA,然後安排您的install鉤子使用它。

source您可以在魅力配置選項的實作中看到一個通用範例mariadb charm 的配置更改鉤子。如果您不需要通用的自訂魅力,您只需添加一行,例如:

 sudo add-apt-repository -y ppa:username/octave

在您的鉤子中安裝軟體包之前install,或者如果您的魅力是用其他語言編寫的,請安裝合適的等效項。

如果您想斷開 MAAS 計算機與 Internet 的訪問,那麼您需要實現自己的本地 apt 存儲庫,然後在 MAAS 計算機上安排魷魚-deb-proxy 以使用它archive.ubuntu.com(假設您已對其進行鏡像),或者否則安排您的安裝掛鉤來配置apt 以使用它。

相關內容