Condor utenti
Cosa è Condor?
Condor è uno strumento per la parallelizzazione distribuita di processi, utile per i lavori computazionalmente pesanti. Esso permette di distribuire il carico su diversi nodi in modo automatico, rilevando quali sono attualmente utilizzati da altri utenti e quali sono liberi.
Utilizzare questo strumento permette di ottenere il massimo della potenza computazionale dal cluster di LCM, senza però disturbare eventuali utenti connessi in locale e facilitando agli amministratori la gestione del carico.
Per ulteriori informazioni e per la documentazione completa (e aggiornata) si rimanda al sito ufficiale.
Istruzioni per i frettolosi
È possibile visualizzare le macchine di LCM su cui è installato Condor tramite il comando:
~$ whoall -cf |
Dopo aver effettuato l'accesso ad una di queste macchine è necessario creare un file di submit che fornisce a Condor le informazioni necessarie, questo è un esempio molto semplice:
# Universo di Condor su cui lanciare il job universe = vanilla # Nome del file eseguibile executable = ./nome_file # Nome dell'eventuale file di input input = nome_file.input # Eventuali opzioni per l'esecuzione da linea di comando arguments = string # Nome del file di output (stdout) output = nome_file.out # Nome del file per gli errori (stderr) error = nome_file.error # File in cui verranno scritte le singole operazioni eseguite da Condor log = nome_file.log # Abilita una notifica al completamento del job e specifica la mail a cui inviarla notification = complete notify_user = nome_utente@pcteor1.mi.infn.it # Istruzione che indica la fine dello script queue
Ora siamo pronti a dare da mangiare al nostro rapace.
~$ condor_submit nome_file_submit |
Questo comando dirà a Condor di lanciare il nostro eseguibile seguendo le indicazioni contenute nel file, dopodiché sarà sufficiente aspettare il completamento del processo.
Per vedere informazioni riguardo i propri job lanciati sui nodi del cluster:
~$ condor_q -global |
Per visualizzare le macchine a disposizione e il loro carico:
~$ condor_status |