Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/23410
Type
ArticleCopyright
Open access
Collections
- IOC - Artigos de Periódicos [12500]
Metadata
Show full item record
SPARKBLAST: SCALABLE BLAST PROCESSING USING IN-MEMORY OPERATIONS
Author
Affilliation
Universidade Federal de São Carlos. Departamento de Ciência da Computação. São Carlos, SP, Brasil.
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ. Brasil.
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ. Brasil.
Universidade Federal de São Carlos. Departamento de Ciência da Computação. São Carlos, SP, Brasil.
Fundação Oswaldo Cruz. Programa de Computação Científica. Rio de Janeiro, RJ, Brasil.
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ. Brasil.
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ. Brasil.
Universidade Federal de São Carlos. Departamento de Ciência da Computação. São Carlos, SP, Brasil.
Fundação Oswaldo Cruz. Programa de Computação Científica. Rio de Janeiro, RJ, Brasil.
Abstract
The demand for processing ever increasing amounts of genomic data has raised new challenges for the implementation of highly scalable and efficient computational systems. In this paper we propose SparkBLAST, a parallelization of a sequence alignment application (BLAST) that employs cloud computing for the provisioning of computational resources and Apache Spark as the coordination framework. As a proof of concept, some radionuclide-resistant bacterial genomes were selected for similarity analysis.
Share