Condor utenti

Cosa è Condor?

Condor è uno strumento per la parallelizzazione distribuita di processi, utile per i lavori computazionalmente pesanti. Esso permette di distribuire il carico su diversi nodi in modo automatico, rilevando quali sono attualmente utilizzati da altri utenti e quali sono liberi.

Utilizzare questo strumento permette di ottenere il massimo della potenza computazionale dal cluster di LCM, senza però disturbare eventuali utenti connessi in locale e facilitando agli amministratori la gestione del carico.

Per ulteriori informazioni e per la documentazione completa (e aggiornata) si rimanda al sito ufficiale.

Istruzioni per i frettolosi

È possibile visualizzare le macchine di LCM su cui è installato Condor tramite il comando:

~$ whoall -cf


Dopo aver effettuato l'accesso ad una di queste macchine è necessario creare un file di submit che fornisce a Condor le informazioni necessarie, questo è un esempio molto semplice:

# Universo di Condor su cui lanciare il job
universe = vanilla

# Nome del file eseguibile
executable = ./nome_file

# Nome dell'eventuale file di input
input = nome_file.input

# Eventuali opzioni per l'esecuzione da linea di comando
arguments = string

# Nome del file di output (stdout)
output = nome_file.out

# Nome del file per gli errori (stderr)
error = nome_file.error

# File in cui verranno scritte le singole operazioni eseguite da Condor
log = nome_file.log

# Abilita una notifica al completamento del job e specifica la mail a cui inviarla
notification = complete
notify_user  = nome_utente@pcteor1.mi.infn.it

# Istruzione che indica la fine dello script
queue

Ora siamo pronti a dare da mangiare al nostro rapace.

~$ condor_submit nome_file_submit

Questo comando dirà a Condor di lanciare il nostro eseguibile seguendo le indicazioni contenute nel file, dopodiché sarà sufficiente aspettare il completamento del processo.

Per vedere informazioni riguardo i propri job lanciati sui nodi del cluster:

~$ condor_q -global


Per visualizzare le macchine a disposizione e il loro carico:

~$ condor_status

Collegamenti esterni