Mejores prácticas

Cómo analizar archivos HTML para la investigación

La investigación sobre sitios web puede adoptar diversas formas y abordar un sinfín de cuestiones de investigación sobre alfabetización digital. En este artículo proponemos una serie de preguntas de investigación sobre archivos HTML y cómo analizarlos.
Roehl Sybing
Content creator and qualitative data expert
  1. Introducción
  2. Investigación de páginas web
  3. Cómo analizar una página web o un documento HTML

Introducción

Es fácil dar por sentada la cantidad de información que nos ha inundado Internet. Todas y cada una de las páginas o archivos de todos y cada uno de los sitios web son nodos de una gran red que los investigadores apenas han empezado a analizar para investigación cualitativa como indagaciones en marketing, comunicación, sociología y toda una serie de campos.

¿Qué implica investigar los archivos HTML y los sitios de Internet? En este artículo, examinaremos las investigaciones que exploran no sólo el texto que se encuentra en Internet, sino también la naturaleza de la información en las alfabetizaciones digitales, sentando las bases para discutir cómo los investigadores pueden llevar a cabo un análisis de datos sobre los recursos en línea.

El texto y las imágenes de un documento HTML pueden analizarse para responder a preguntas sobre alfabetización digital.

Como realizar investigaciones en páginas web

Hace tiempo que existe una diferencia fundamental entre los textos tradicionales y los archivos HTML. Imagínese leer un libro o una enciclopedia. Puede hojear el texto, página a página, o desplazarse hasta el lugar más relevante del texto para obtener la respuesta que busca. Podrías estar hojeando cientos o incluso miles de páginas, ¡a menudo más de las que te caben en la mochila o en una mesa de trabajo!

Un sitio web o una red de sitios web se construyen de forma diferente, cambiando la naturaleza misma de cómo las personas encuentran información o realizan análisis. Los enlaces conectan las páginas entre sí, lo que significa que los lectores pueden saltar de un texto a otro con más facilidad y rapidez que si estuvieran hojeando pilas de libros u otras publicaciones en papel. El poder de este medio se ha puesto de manifiesto con la llegada de los motores de búsqueda y los chatbots, donde la recuperación de información es casi instantánea y sin esfuerzo.

Además, Internet es más que una simple colección de textos. Mientras que las páginas web se diseñaron inicialmente simplemente para almacenar registros o información, los sitios web se han vuelto mucho más sofisticados, sirviendo como tablones de mensajes, plataformas de medios sociales, servicios de intercambio de archivos e incluso juegos en línea.

El advenimiento de las alfabetizaciones digitales impulsado por Internet ha supuesto un avance significativo para la investigación cualitativa, no sólo en cuanto a la amplitud y profundidad de la información que se hace más fácilmente accesible, sino también en la forma en que las personas se comunican y comparten información entre sí. En lugar de tratar los sitios web como simples versiones digitales de libros u otros textos, los investigadores deberían considerar Internet como un medio de comunicación totalmente distinto.

La adaptación de los sitios web a un navegador proporciona información útil sobre el comportamiento de los usuarios. Fotografía de rivage.

Por supuesto, los investigadores pueden utilizar simplemente páginas HTML como fuente de texto para su investigación cualitativa. En ese caso, los enfoques tradicionales como análisis temático, teoría fundamentada, análisis del discurso y el análisis de contenido son métodos útiles para extraer ideas de los datos textuales, sobre todo si lo que se busca es comprender el significado de los textos en línea.

Sin embargo, existen innumerables vías de investigación cuando se trata de analizar sitios web. Piense en cómo un sitio web enlaza con otro, o cómo una página conecta con otras. A diferencia de lo que ocurre con los medios de comunicación tradicionales, un link conecta fuentes de información y plataformas entre sí, modificando el comportamiento de los usuarios que, de otro modo, hojearían los textos para identificar las respuestas que buscan.

Esto crea un lenguaje totalmente nuevo para entender cómo la gente comunica el conocimiento. Por ejemplo, un artículo de un blog o una publicación en redes sociales puede "hacerse viral" cuando un número significativo de usuarios enlaza a la misma fuente a la vez. La naturaleza de esta viralidad invita a plantearse una serie de interesantes cuestiones de investigación en campos como la sociología, el marketing y la comunicación.

El diseño de sitios web también plantea otras cuestiones de investigación. Por ejemplo, ¿cómo y por qué se adaptan los sitios web a un determinado navegador en lugar de a otros? ¿En qué consiste un "buen" diseño web, sobre todo teniendo en cuenta el creciente uso de teléfonos inteligentes para buscar en Internet? Realizar análisis para responder a estas preguntas requiere recopilar no sólo datos textuales, sino datos multimedia para captar la experiencia completa de navegar por un sitio web.

Cómo analizar una página web o un documento HTML

Las consideraciones más obvias para la investigación de páginas web implican cuestiones de recopilación de datos y organización de datos. Llevar a cabo una investigación cualitativa de forma eficiente depende a menudo de asegurarse de que las partes más destacadas de los datos se capturan en detalle y luego se organizan de forma que permitan la categorización y división de los datos en unidades discretas de análisis.

La recopilación de datos de sitios web requiere una cuidadosa consideración de lo que se pretende examinar en el estudio. Si lo que busca es simplemente un análisis de texto, entonces es cuestión de copiar y pegar el text de una página web, un post u otra forma de entrada. Pero si su pregunta de investigación tiene más que ver con cómo se transmite la información o cómo la gente los utiliza, entonces su diseño de investigación requiere un mayor desarrollo para incluir datos no textuales como elementos visuales y de audio.

Para ello, la captura de datos de páginas HTML puede requerir una herramienta de captura de pantalla o la posibilidad de imprimir PDF para documentar los elementos de diseño de los sitios web. La mayoría de los navegadores modernos ofrecen a los usuarios la opción de convertir páginas HTML en archivos PDF que un software de análisis cualitativo de datos, como ATLAS.ti, pueden analizar. También existen otras herramientas que permiten a los usuarios descargar vídeos o archivos de audio de sitios web para compartir vídeos o plataformas de medios sociales como Twitter/X, Instagram y TikTok.

Ten en cuenta, sin embargo, que si quieres realizar un análisis documental de los datos de las redes sociales, te convendría tratar cada publicación como un documento propio o codificar los datos de forma que puedas identificar al autor o el contexto de cada publicación. Además, puede considerar la posibilidad de analizar los comentarios de una publicación seleccionada en las redes sociales, en cuyo caso podría descargar todos los comentarios e importarlos a un software de análisis de datos cualitativos, como ATLAS.ti. Independientemente de los datos que desee capturar, es importante poder categorizar los datos por unidades cohesivas de análisis para facilitar la codificación cualitativa más adelante.

Como con cualquier dato cualitativo, los investigadores también deben abordar las consideraciones éticas de tomar datos de cualquier sitio web. Especialmente cuando se trabaja con datos de audio o vídeo, hay cuestiones de derechos de autor y propiedad intelectual que protegen la inversión de tiempo, dinero y esfuerzo de los creadores al publicar o desarrollar un sitio web. También hay cuestiones de manejo información personal o confidencial para que no se utilicen injustamente. Para ello, asegúrate de anonimizar cualquier información personal y limitar la difusión de datos sin procesar de sitios web para mitigar cualquier consideración sobre derechos de autor y, al mismo tiempo, preservar la esencia de los datos que intentas capturar. Hacerlo antes del análisis de los datos puede ahorrar mucho tiempo a la hora de abordar cualquier obstáculo a publicación de la investigación planteado por las quejas de los autores originales.