Lidiando con datos difíciles

Autor: Michael T. Hoesing, CISA, ACDA, CDP, CFSA, CIA, CISSP, CMA, CPA
Fecha de Publicación: 10 May 2017
English

Aplicar técnicas de análisis de datos (AD) al proceso de auditoría interna de los sistemas de información (SI) se ha movilizado desde una actividad deseada a una requerida.

El análisis de datos puede ser aplicado a una gran variedad de actividades de auditoría de SI—evaluación de riesgo anual, revisión analítica del acuerdo para soportar la planificación, pruebas de control de SI y seguimiento de hallazgos.1, 2, 3, 4 Aplicar AD puede ayudar a lograr mejor cobertura de riesgo y más pruebas costo efectivas.

El fallo de los programas de AD en auditoría interna es más frecuente que lo deseado. Las razones para la falta de éxito están relacionadas con las causas raíz de:5

  • Falta de apoyo en lo alto
  • Inhabilidad para acceder a datos apropiados de manera oportuna
  • Falta de talento
  • Ausencia de criterios de éxito, procesos y procedimientos
  • Falta de acogida de los miembros del departamento no relacionados con AD

Asegurar que las trampas previas no descarrilen un programa AD empresarial requiere superar un diferente grado de desafíos políticos, de procesos y económicos para superar entre las organizaciones. Las empresas que han establecido programas fuertes de gobierno de datos que definen estándares para estructuras de datos y consistencia pueden evitar muchos de los asuntos mencionados en este artículo.

La descomposición de procesos puede reducir el impacto de un programa AD. Fallar en validar los datos puede llevar a un análisis inapropiado y puede ser causado por:

  • Falta de procedimientos de balance y reconciliación para asegurar la completitud y precisión de los datos
  • No revisar las fuentes de donde los datos se obtienen para asegurar que los datos se alinean con los objetivos de la auditoría
  • No asegurar que las herramientas y consultas que son usadas para obtener los datos son aplicadas en forma precisa a los datos en el alcance

La inhabilidad para ejecutar es otra razón porque un programa de AD puede fallar o entregar menos de lo esperado. No ser capaz de completar un análisis solicitado disminuye el impacto positivo de un programa de AD. Una barrera clave para la ejecución es la baja calidad de los datos disponibles para un AD. Los datos pueden ser más difíciles de trabajar si contienen características estructurales que algunas herramientas típicas de escritorio pueden no ser capaces de ajustarse a ellas. Microsoft Excel es un medio de entrega común para proveer datos a los auditores. La flexibilidad de Excel fija el escenario para contenido inconsistente, que resulta en archivos que pueden ser difíciles de usar con herramientas convencionales de AD.

Los desafíos de calidad de los datos pueden presentarse al nivel de los archivos, por ejemplo, tamaño total de archivo. Muchos analistas de datos de auditorías están usando herramientas de escritorio o portátiles con limitaciones en los recursos de memoria, y algunas veces archivos más grandes que no pueden abrir. Algunos softwares de análisis de datos tienen limitaciones en el tamaño de un registro que pueden procesar. Un archivo que esté codificado usando un formato como Unicode puede llegar para análisis. Ese formato puede requerir una versión especial de software no disponible para el analista. Los analistas pueden estar trabajando en un ambiente que produce archivos desde varias plataformas y sistemas operativos que estructuran los datos de manera diferente.

Excel, mientras hace fácil entregar datos a los auditores, puede presentar problemas en la calidad de los datos. Excel permite la presentación flexible de texto permitiendo saltos de línea y tabulaciones de alineación dentro de una celda que puedan causar problemas de interpretación en el análisis durante la importación. Las herramientas de análisis frecuentemente esperan que Excel contenga los títulos de las columnas en la fila 1; los títulos u otras narrativas involucrando más de la primera línea de la hoja pueden hacer la importación al software de análisis difícil. Los receptores de la salida del análisis pueden tener limitaciones respecto a los tipos de archivos que podrán procesar. La habilidad de cambiar el tipo (por ejemplo, CSV, XML) del contenido del Excel amplía la audiencia para los resultados. Por ejemplo, cuando se procesan múltiples libros de trabajo de Excel para diferentes subsidiarias, nombres de hoja inconsistentes pueden perjudicar los procesos automáticos para importar múltiples archivos. Cambiar el nombre de la hoja dentro de un libro a una nomenclatura estándar convenida puede facilitar la carga automatizada de datos. Si una hoja de Excel utiliza color de celda para indicar un contenido, ese color no puede ser interpretado o procesado por las herramientas de análisis. Convertir colores de celdas de Excel en cadenas de texto puede habilitar el continuar procesando.

Otros asuntos de archivo de origen que pueden necesitar ser superados antes que el análisis pueda continuar incluyen:

  • Caracteres de control de dispositivos como tabulaciones (tab) y saltos de línea (intro) pueden causar problemas de interpretación durante la importación de otros tipos de archivos, no solo Excel.
  • Los archivos de reporte merecen su propio tratamiento, pero un acercamiento general, como aquel discutido en este artículo, proveerá ayuda en gran variedad de archivos de reporte con diferentes estructuras.
  • Los datos comprimidos usualmente necesitan ser descomprimidos usando herramientas y software que puede ser parte del proceso original de compresión antes de ser analizados con otro software de análisis más adelante en el proceso.

Este artículo profundiza en estos asuntos de calidad de datos y sugiere técnicas para superarlos.

Asuntos de nivel de archivo y nivel de registro

Considerando la llegada de los datos como el nivel más alto de agregación en archivos y técnicas aplicadas al nivel de archivos que puede impactar variados registros, la discusión comenzará en el nivel de archivos y registros. Las correcciones a estos niveles deben hacerse usualmente primero, antes que los datos puedan ser recibidos por herramientas convencionales de análisis.

Tamaño de archivo muy grande
Es valioso revisar los datos nativamente, usando el software con el cual los datos fueron creados (por ejemplo, Excel) o usando editores (por ejemplo, Bloc de Notas), antes de usar los datos en herramientas de análisis. Algunos softwares de AD tratan de cargar el archivo completo para procesarlo en la memoria. Un archivo muy grande puede exceder las limitaciones de memoria de la máquina. Si el archivo de datos es consistente en su estructura, la revisión de un subconjunto de registros puede ayudar a confirmar la estructura, como delimitadores y calificadores de caracteres.

Microsoft PowerShell es una plataforma de automatización y escritura que está construida sobre el marco de trabajo .NET.6 El siguiente escrito de PowerShell transmite a un archivo, sin importar su tamaño total, y luego extrae un subconjunto de 100 registros:

Get Content “\\path\sourcefile.txt” | Select –First 100 |Out-File-FilePath”\\path\sourcefile_first_100_ records.txt” –Encoding ASCII

Los comandos y parámetros del escrito funcionan como se indica a continuación:

  1. El comando Get-Content localiza y abre el archivo que está especificado entre comillas, por ejemplo, “\\path\sourcefile.txt”.
  2. |(El primer canal o barra vertical) envía el resultado del comando previo Get-Content al comando Select subsiguiente.
  3. –First (el parámetropara el comando Select) especifica cuántos registros se obtendrán (100).
  4. |(El segundo canal) envía el resultado de los dos comandos (100 registros) hacia el comando Out- File, el cual crea un nuevo archivo.
  5. –FilePath (el parámetro para el comando Out- File) especifica la ubicación y nombre del nuevo archivo, por ejemplo, “\\path\sourcefile_first_100_ records.txt”.
  6. -El parámetro de codificación especifica el nuevo tipo de archivo (ASCII). Nota: El tipo de archivo por omisión de PowerShell al crear un archivo de resultados es Unicode.

Gran longitud de registros
Un archivo puede contener algunos registros que tengan gran cantidad de bytes. La cantidad de bytes puede exceder los límites de capacidad que las herramientas de análisis refuerzan. Por ejemplo, la versión 2016 de Excel no puede tener un campo de caracteres mayor a 32.767 bytes. Microsoft ACL para Windows 11.4.2 es un producto de análisis de datos que tiene un límite máximo de bytes por registro de 32.767, aunque puede procesar archivos con tantos registros como el sistema operativo permita. El siguiente escrito de PowerShell determina si cualquier registro de un archivo supera ese límite. Este escrito escribe (valga la redundancia) los primeros 25 caracteres del registro excedido en la pantalla y trabaja mejor si el archivo contiene unos pocos registros infractores. Si la salida por pantalla es vacía, luego el archivo tiene todos sus registros dentro del límite.

$data=Get-Content ”<turuta><tuarchivo>”
foreach($line in $data)
{
If ($line.Length –gt 32767)
{Write-Host "Un acierto"
Write-Host $line.substring(1,25)
}
}

Los comandos, parámetros y variables del escrito funcionan como se indica a continuación:

  • $data—Variable para almacenar los contenidos del archivo
  • foreach—Se mueve cíclicamente por las líneas del archivo de datos
  • if—Prueba lógica
  • $line—Variable que almacena el contenido de cada línea
  • .Length—Identifica el atributo del número de bytes para cada línea procesada
  • -gt—Prueba lógica para mayor que
  • Write-Host—Dirige la salida hacia la pantalla
  • .substring—Atributo de un segmento de cada línea procesada

Codificación de archivo unicode
Algunas veces, los archivos Unicode deben ser procesados con versiones especiales de software. Puede ser más sencillo trabajar con los datos en una herramienta que esté diseñada para manejar archivos con codificación ASCII. Convertir un archivo Unicode a ASCII puede ser logrado en la línea de comando de Windows, con el comando:

TYPE:

C:\> TYPE unicodefile > asciifile

PowerShell logra el mismo resultado con el siguiente comando (PowerShell crea su salida como archivo Unicode, salvo que el switch codificador - se utilice para producir un archivo ASCII):

PS> Get-Content sourceunicodefile | Out-File-Encoding ASCII asciioutputfile

Ambos comandos crean una copia adicional de los datos; sin embargo, si hay espacio de almacenamiento disponible, debe hacerse una copia del archivo de origen antes de llevar a cabo cualquiera de las técnicas de mejora en esta y las secciones posteriores para preservar la cadena de evidencia. También, cualquier archivo derivado en esta o las secciones posteriores debe ser balanceado y reconciliado con el sistema de registro y tener otras técnicas de validación (por ejemplo, campos clave malformados, campos vacíos, omisiones, duplicados, valores fuera de rango) aplicadas según se requiera.

Marcadores de fin de registro UNIX/Linux
Algunas veces, un archivo tiene un salto de línea (SL) en la mitad de un registro que puede afectar la importación de datos. SL es usado en sistemas Linux/Unix para indicar un marcador de fin de registro. Esta situación puede usar el proceso de importación para tratar de crear dos registros cuando sólo uno es apropiado cuando el software de análisis está procesando un archivo de Windows.

Si el archivo está en un formato de Windows, el marcador de fin de registro estándar es el retorno de carro y salto de línea (x0D y x0A). El proceso para remover el salto de línea individual (SL) incluye dos pasos.

  1. Encontrar y reemplazar todos los bytes del SL en espacios en blanco individuales. Este proceso también cambia todos los marcadores de fin de registro a RC (retorno de carro con un espacio en blanco).
  2. Encontrar y reemplazar todas las instancias de RC con RCSL.

El editor de texto Notepad puede ser utilizado para crear una copia revisada de los datos con posterioridad a que se hagan los respaldos del archivo de origen. Primero, cambia el salto de línea (figura 1):

  1. En la configuración de Vista, seleccione Mostrar Símbolos luego seleccione Mostrar todos los caracteres. El retorno de carro y los saltos de línea están en video reverso.
  2. Seleccione el menú Buscar, luego seleccione Reemplazar.
  3. En la celda Encontrar qué, ingrese \n. Esto especifica que los saltos de línea serán buscados.
  4. En la celda Reemplazar con, ingrese un espacio unitario usando la tecla espacio.
  5. Seleccione la opción Extendido para habilitar trabajar con los símbolos de caracteres de control de dispositivos (\n para saltos de línea (SL) y \r para retorno de carro (RC) mejor que con los literales.
  6. Seleccione Reemplazar Todos. Todos los saltos de líneas serán reemplazados con un espacio. El retorno de carro se mantiene.

Después de que todos los caracteres de control de dispositivos SL sean removidos, el archivo contiene una línea por registro. Las tres líneas en la figura 1 son ahora dos líneas en la figura 2, y cada línea es un registro. Cada línea es terminada con un caracter unitario para retorno de carro (RC). Para reemplazar el RC con RCSL (figura 2):

  1. En la configuración de Vista, con el panel Reemplazar abierto, seleccione la opción Extendido.
  2. En la celda Encontrar qué, ingresar \r. Esto especifica que los retornos de carro serán buscados.
  3. En la celda Reemplazar con, ingrese \r\n.
  4. Seleccione Reemplazar Todos. Todos los retornos de carro son reemplazados con retornos de carro y saltos de línea (RCSL), que corresponde con la designación de fin de registro de Windows.

Las dos líneas en la figura 2 son dos registros donde cada uno finaliza con la designación de fin de registro de Windows RCSL.

Asuntos en Excel

Excel es una herramienta de escritorio popular y asequible, y muchas aplicaciones que los auditores desean analizar tienen la capacidad de exportar sus datos a Excel. La estructura de archivos Excel es una forma conveniente de reunir evidencia de auditoría; sin embargo, es importante entender los desafíos que este formato puede presentar para permitir la corrección.

Formato de control de dispositivo en campos de caracteres
Los caracteres de control de dispositivos formateo en campos de caracteres de dispositivos de control, como saltos de línea en una celda de texto dentro de una hoja de trabajo de Excel, puede causar que el software de análisis rompa una línea de Excel en múltiples registros. En muchos casos, una línea en una hoja de Excel representa un registro completo; romper una línea de Excel en el medio puede causar malinterpretación durante la importación a una herramienta de análisis. Además, los caracteres de control de dispositivos dentro de un campo de texto causarán que el comando ACL VERIFY reporte un error en la tabla importada (figura 3). Si la solución de ACL está en un escrito, detenga el escrito ante cualquier error de tipo VERIFY. Si esta situación no es considerada un error crítico por el cual valga la pena detener el procesamiento, puede ser corregido en Excel antes de la importación:

  1. Si una hoja de trabajo tiene la columna B con saltos de línea creados usando Alt+Enter, luego inserte una nueva columna frente a B usando la fórmula =LIMPIAR(C1).
  2. Copiar la fórmula de la columna C en todas las filas de la columna B.
  3. Seleccionar en la hoja de trabajo el dato requerido, incluyendo la nueva columna y excluyendo la columna dañada (columna B, que contiene los saltos de línea).
  4. Pegar los valores especiales a una nueva hoja de trabajo.

La nueva hoja de trabajo no tendrá los caracteres de control de dispositivos (por ejemplo, tab, RC y SL) embebidos en el contenido de la celda; por lo tanto, el software de análisis en flujo descendente no intentará romper un registro individual en múltiples registros durante un paso de importación, porque la estructura de Excel identificará la terminación de un registro utilizando su numeración de línea propietaria en vez de RCSL.

Líneas de encabezado múltiples
Lo esperado por la mayoría de los softwares de análisis para una hoja de trabajo de Excel es que la fila 1, opcionalmente, contenga los títulos de campo o de columna. Si existen filas sobre la primera fila o filas de título estas deben ser eliminadas antes de la importación.

La eliminación de estas filas iniciales de una hoja de trabajo de Excel se puede lograr manualmente. Sin embargo, con múltiples libros de trabajo y la misma ocurrencia de filas que no son de título repetidas en cada libro de trabajo, puede ser más eficiente ejecutar un escrito de PowerShell dinámicamente, sustituyendo los nombres de los libros de trabajo de Excel sucesivamente. Esto puede lograrse con un escrito de ACL al:

  • Inventariar los nombres de los archivos de Excel para importar con el comando DIRECTORY y redirigiendo los resultados a una tabla ACL
  • Procesar cada nombre de archivo en dicha tabla uno a la vez usando un sub-escrito y un contador unitario con el comando LOCATE RECORD para secuencialmente abordar cada nombre de archivo
  • Crear el escrito de PowerShell con el nombre de archivo actual dentro del sub-escrito usando los comandos ACL LIST UNFORMATTED para crear un archivo de texto con una extensión PS1 que pueda ser procesada por lotes en PowerShell
  • Ejecutar el escrito por lotes .PSI de PowerShell en ACL usando el comando EXECUTE para producir la versión limpia del archivo Excel. Una copia del archivo Excel se hace y se limpia para preservar el archivo original.
  • Usar el comando ACL IMPORT para construir la estructura y datos de su tabla ACL
  • Repetir hasta que todos los archivos listados hayan sido procesados. Utilizar el comando DO SCRIPT WHILE de ACL.

Los comandos clave de PowerShell para remover el número de líneas extrañas al inicio de la hoja incluyen:

  • $Workbook = $xl.Workbooks.open($filepath) para abrir el libro de trabajo actual de Excel
  • $ExcelWorkSheet = $xl.WorkSheets.Item(1) para abrir la primera hoja dentro del libro de trabajo
  • $ExcelWorksheets.Cells.Item(1,1).EntireRow. Delete() para quitar la primera fila de la hoja (repetitivamente). El escrito de ACL solicita al usuario especificar el número de filas encabezado a eliminar sobre la fila de título. Dentro del escrito de PowerShell, esta línea se repite con tanta frecuencia como indique el usuario. Si hay un gran número de líneas iniciales a borrar dentro de la hoja, un comando FOREACH puede ser más apropiado

Nota: La fila 1 es borrada en forma repetitiva, porque la fila 2 se convierte en la fila 1 luego de que la fila 1 original es borrada.

Reescribiendo un libro de trabajo
En algunos casos, el software de extracción no puede crear un archivo en formato Excel y crea un archivo en formato valores separados por comas (CSV). Luego que el archivo CSV es creado, su estructura de archivo puede ser reescrita a un archivo Excel en formato XLSX para permitir mejoras en el formato y otras funciones a ser usadas dentro de Excel. Algunas veces los procesos de exportación limitan el ancho de una celda de texto cuando se exporta directamente a Excel, resultando en datos truncados. Exportar a un archivo de tipo CSV no tiene un requerimiento tan restrictivo como el ancho de campo, reduciendo las instancias de truncado. Use los siguientes comandos de PowerShell para abrir un archivo CSV y volver a guardarlo en un formato Excel XLSX:

$excel = New-Object -ComObject "Excel.
Application"
$excel.DisplayAlerts=$False
$excel.Visible=$False
$workbook = $excel.Workbooks.Open(
“<<yourpath>><<yourfilename>>.CSV")
$workbook.
SaveAs(“<<yourpath>><<yourfilename>>
.XLSX", 51)
$excel.Quit()

El valor “51” indica un tipo de archive Open XML de libro de trabajo.7

Renombrar una hoja de trabajo
Una empresa puede requerir normalizar los nombres de los archivos de las hojas de trabajo de Excel para ejecutar análisis de datos. Por ejemplo, un libro de trabajo estándar de Excel con hojas de trabajo estándar es distribuido por la casa matriz de una empresa a docenas de subsidiarias. Cuando los múltiples libros de trabajo son regresados a la casa matriz, se evidencia que fueron modificados por los usuarios finales, lo que dificulta la agregación. Los siguientes comandos de escrito de PowerShell pueden ser añadidos a un escrito existente de PowerShell para normalizar los nombres de las hojas de trabajo:

$ExcelWorkSheet = $xl.WorkSheets.item(1)
$ExcelWorkSheet.Name = "Sheet1“
$xl.ActiveWorkbook.Save()

El primer comando carga la primera hoja de trabajo física ”…ítem(1).”Las hojas de trabajo pueden también ser abordadas por su nombre si son conocidas y tienen una estructura consistente por parte de los usuarios finales.

El segundo comando define el nuevo nombre de la hoja de trabajo cargada, el comando final guarda la hoja de trabajo de Excel y el nombre corregido de la hoja de trabajo es guardado como parte del libro de trabajo.

Convirtiendo las celdas coloreadas de excel en datos
El color añadido a las celdas de una hoja de trabajo puede tener un significado y ser visualmente llamativo, pero ese significado o contexto no puede ser interpretado durante la importación en la mayoría de los softwares de análisis. Usualmente, los colores de las celdas tienen un significado consistente a través de la hoja (por ejemplo, verde = diseño, azul = desarrollo, naranjo = pruebas). Antes de la importación, los colores de las celdas de las hojas de trabajo pueden ser determinados y basados en el valor numérico de los colores. Columnas de texto adicionales pueden ser añadidas con descripciones contextuales. Estas descripciones pueden ser usadas posteriormente en el software de análisis para agregación y filtrado. Los comandos de PowerShell que logran esto incluyen:

$a = $ExcelWorkSheet.Cells.Item($r,$i -
$NúmerodeColumnas).Interior.ColorIndex
If ($a -eq 43) # Verde
{
$ExcelWorkSheet.Cells.Item($r, $i) = 'Diseño'

El primer comando pregunta el color de la celda (Interior.ColorIndex) y asigna ese valor a la variable $a. El siguiente comando revisa el contenido de la variable $a (43 es verde)8 y asigna el contenido de la nueva columna y celda de la fila la cadena de texto (‘Diseño’) para ese color. Usar algunos operadores “while” anidados dentro del escrito de PowerShell, las filas ($r) y las columnas ($i) pueden ser revisados en un ciclo, haciendo los cambios progresivamente a través de la hoja de trabajo.

Otros asuntos

Los formatos de archivo de casos especiales usualmente funcionan bien con el propósito original para el que fueron diseñados—Los archivos de Intercambio Electrónico de Datos (EDI) para consistencia de la transmisión, reportan archivos para transferencia de expedientes a impresoras y archivos comprimidos para conservar el espacio de almacenamiento. Sin embargo, estos archivos a veces necesitan un tratamiento especial antes de su uso para, o en, herramientas de propósito general.

Los caracteres de control de dispositivos fuera de Excel
Los editores hexadecimales de Excel pueden revelar y rectificar algunos códigos de caracteres dentro de un archivo antes de causar problemas. Los códigos x01 hasta x1F (1 al 31 decimal) del Código Americano Estándar para el Intercambio de Información (ASCII) son generalmente utilizados para controlar dispositivos y normalmente no son datos. Reemplazar estos caracteres de control con un espacio en blanco (código x20 de ASCII, por ejemplo, decimal 32) usualmente no daña el contenido y pueden ser necesarios en el archivo para procesar las importaciones y comandos de verificación en el software de análisis de datos.

Archivos de reporte desafiantes
Los archivos de reporte fueron diseñados para ser placenteros de leer. Ellos contienen espacios en blanco, encabezados de columna y página, e ítems que no son datos. Convertir un archivo de reporte en datos depende de una ubicación física consistente de los datos horizontal y verticalmente en el reporte. Muchas herramientas de importación dependen de la consistencia para convertir el reporte en datos. Algunas herramientas de software pueden tener dificultades para distinguir la ubicación de los datos si esta oscila (por ejemplo, izquierda o derecha, o arriba o abajo) dentro del reporte.

Los archivos de reporte inconsistentes pueden ser abordados con software construido con software específico de propósito.9 Los archivos de reporte inconsistentes también pueden ser ingresados en otras herramientas de análisis de datos, incluso si la ayuda tutorial en esas herramientas no puede manejar la complejidad de la estructura de los reportes. Estas otras herramientas pueden tener la capacidad de importar el reporte en un campo de un carácter que tenga una longitud suficiente para obtener la línea más ancha del reporte. Luego que un reporte es cargado en el software de análisis, las funciones y comandos de análisis gramatical pueden ser usados para identificar los segmentos de datos, por ejemplo, SPLIT, SUBSTR, LAST, REVERSE, los que usualmente son usados dos veces—una para abordar la cadena de caracteres por la derecha, y nuevamente para restaurar el orden original—dentro del extenso e inclusivo campo de caracteres.

Desempacando un certificado comprimido lista de revocación
Si uno quiere comparar los números seriales de certificados contra los números seriales en una lista de revocación de certificados (archivos de tipo .CRL), un paso preliminar debe efectuarse para descomprimir el archivo .CRL nativo. Una máquina con OpenSSL instalado debiera tener el módulo utilitario crlutil instalado. Esa herramienta puede ser usada para convertir el archivo .CRL comprimido en un archivo de texto, que puede ser importado por la mayoría de las herramientas de análisis de datos. El switch—S (sensible a mayúsculas y minúsculas) es para mostrar, o desplegar, el archivo. El switch— i designa el archivo fuente .CRL como la entrada a descomprimir. El archivo resultante tiene marcadores de Linux de fin de registro (SL solamente). Para desempacar un archivo de lista de revocación de certificados:

/usr/bin/crlutil -S -i "yourcrlfile.crl" >
Suarchivocrldescomprimido.txt

Conclusión

Hay muchas opciones técnicas que son utilizadas para construir los archivos de datos. Algunas de esas opciones hacen la importación y análisis de datos desafiante. Este artículo listó varios de esos desafíos y entregó algunas ideas sobre cómo superar los impedimentos y lograr los objetivos empresariales de auditoría.

Luego que los asuntos de estructura y consistencia han sido resueltos, la copia mejorada del archivo de datos puede ser importada por en herramientas de análisis. Luego, el conocimiento resultante, la síntesis y las ideas provistas por el análisis pueden mejorar la evaluación de riesgo de la auditoría y proceso de pruebas.

Notas Finales

1 ISACA, Data Analytics—Practical Approach, USA, 2011
2 Lambrechts, A.; J. Lourens; P. Millar; D. Sparks; “GTAG16: Data Analysis Technologies,” The Institute of Internal Auditors (IIA), August 2011, www.theiia.org/guidance/technology/gtag-16/?sf2002075=1
3 Stippich Jr., W.; B. Preber; Data Analytics: Elevating Internal Audit’s Value, IIA, April 2016, https://bookstore.theiia.org/data-analytics-elevating-internal-audits-value
4 Verver, J.; Workbook for a Successful Audit Analytics Program, High Water Advisors, April 2016, www.highwateradvisors.com/workbook-for-a-successful-audit-analytics-program
5 Op cit, Lambrechts
6 Microsoft, “What is PowerShell?” 2016, https://msdn.microsoft.com/en-us/powershell/mt173057.aspx
7 Microsoft, “XlFileFormat Enumeration (Excel),” https://msdn.microsoft.com/en-us/library/office/ff198017.aspx
8 Chisholm, R.; “Adding Color to Excel 2007 Worksheets by Using the ColorIndex Property,” Microsoft, February 2008, https://msdn.microsoft.com/en-us/library/cc296089(v=office.12).aspx
9 Datawatch Monarch software is designed to turn report files into data, www.datawatch.com.

Michael T. Hoesing, CISA, ACDA, CDP, CFSA, CIA, CISSP, CMA, CPA
Se reunió al equipo de auditoría interna de First Data en Julio 2015, liderando la construcción del equipo de análisis de datos. Las experiencias recientes de Hoesing incluyen entrenamiento y consultoría como maestro entrenador par5a ACL Services Ltd., auditor líder de SI en el departamento de auditoría interna del First National Bank de Nebraska, gerente senior de gestión de riesgo operacional y de sistemas para PriceWaterhouseCoopers, director de auditoría para American Express y First Data, y otras posiciones en contabilidad pública con McGladrey y otras firmas regionales. Hoesing es también instructor adjunto en la Universidad de Nebraska en Omaha (EEUU), enseñando la clase de auditoría de SI de mayor duración del área a estudiantes graduados.