Introducción: observar la datificación desde la perspectiva de Verón
Hace aproximadamente dos siglos, la organización de redes de datos estructuradas como información dio cabida a la estadística, redes que sustentan las políticas de Estado basadas en información censal (Hacking, 1990; Desrosières, 2004; Brine y Poovey, 2013). Algunos de sus empleos y derivaciones resultaron en la asunción de que la información obtenida del rastreo censal y el cruce de datos es neutral y precisa y que los algoritmos que conectan a los usuarios con sus intereses se pueden predecir y hasta es posible determinar sus movimientos. Ante ello, la tecnología se presenta como la solución "perfecta" al problema de la interferencia "humana" en la transmisión y organización "objetivas" de los datos.
Al frente de la reproducción de este modelo ideológico, hay actores (empresas, Estados, ciencia) que intervienen como gestores en la optimización tecnológica de las comunicaciones y la obtención y procesamiento de datos. La evolución de los sistemas de comunicación y su progresiva digitalización coinciden con lo que se ha venido llamando la datificación de la sociedad (Hintz, Dencik y Wahl, 2018), que sin duda arraiga en esos desarrollos y en esa ideología de dos siglos de duración. En este sentido, recientemente Dencik y Kaun (2020) escribieron sobre los Estados de bienestar y las corporaciones como colectores insaciables de datos.
Encargados de generar y optimizar datos para anticipar acciones o comportamientos, esos actores encarnan lo que podríamos llamar autoridades interpretativas. Su autoridad emerge de la conjugación de tres asimetrías entre sus capacidades y las del resto de los actores sociales: primero, una elaboración altamente tecnologizada de datos e información para alimentar los sistemas de estructuración y gestión de datos; segundo, un acceso privilegiado a la infraestructura de esa tecnología, y tercero, una pobre difusión de los vínculos entre esa infraestructura profunda (deep mediatization) (Hepp, 2020) y la organización discursiva en superficie (Zuboff, 2015). Estas tres asimetrías impactan notablemente en las prácticas y políticas estatales y comerciales basadas en la datificación. Para poder revertir y comprender esas asimetrías y sus impactos sociales, este artículo se alinea con los trabajos que consideran necesario que las ciencias de la comunicación elaboren estudios y teorías que den cuenta de los modos en que la datificación se produce y utiliza.
En este sentido, estas páginas recuperan un desarrollo teórico útil para comprender el proceso de datificación, consistente en una teoría sobre la red de procesos sociales de producción de sentido en sociedades mediatizadas. Ese desarrollo tuvo su origen en la figura de Eliseo Verón, quien produjo en el último cuarto del siglo XX una teoría sociosemiótica (1988) en articulación con una temprana teoría de la mediatización (Verón, 1981; 2004). Recientemente, los desarrollos de su teoría han empezado a dialogar (Scolari y Rodriguez-Amat, 2018) con el contexto de la profunda transformación del ecosistema comunicativo: la datificación. El propósito de este artículo es mostrar que la perspectiva veroniana permite analizar el proceso de atribución de sentido de los datos, y, como tal, se ofrece como una oportunidad analítica que permitirá identificar lo que llamamos autoridades interpretativas.
El texto se estructura en tres partes. Primero, una revisión de la dispersa literatura alrededor del repertorio de conceptos que se extienden desde la datificación hasta la vigilancia basada en datos, desde el big data hasta las leyes de protección de ciudadanos y las estrategias de resistencia cívica. La segunda parte toma posición, desde la perspectiva veroniana, frente a la producción social de sentido para introducir la cuestión de los procesos interpretativos entrañados en las diferentes conceptualizaciones sobre los datos y la datificación. Y tercero, el texto argumenta cómo la producción, la circulación y el reconocimiento -categorías propias de la perspectiva de Verón- revelan espacios de interpretación que forman parte de la naturaleza fundamental de los datos y su manejo asimétrico por parte de las autoridades interpretativas.
Estado de la cuestión
En este escrito entendemos la datificación como "the representation of social life through computerized data across media devices and their underlying software and infrastructures" (Hepp, 2020, p. 40). Es, tal como lo entiende Van Dijck (2014), una suerte de paradigma con legitimidad para entender el comportamiento social que ha ido cobrando fuerza con el advenimiento de la web 2.0 y los sitios de redes sociales, a partir del cual, fundamentalmente, se observan los esfuerzos por codificar muchos aspectos de la vida social.
La preocupación en torno a la computarización de nuestras vidas y la creciente intervención de los procesos de datificación -entendidos desde su remota "estadistificación"- no han sido igualmente atendidas a lo largo de los años. Sin embargo, la reciente transformación del ecosistema comunicativo en su deriva hacia una sociedad pendiente de los datos digitales generó una oleada de debates y de atención (más académica que social y más corporativa que política en los escenarios gubernamentales). Describir rigurosamente y en poco espacio la dispersión y fragmentación de estos debates resulta imposible.
Por esta razón, y con ánimo más descriptivo que polémico, hemos desplegado un mapa de las líneas más consolidadas de exploración.
Por supuesto, es un esquema orientativo que muestra la extensión de una preocupación académica general sobre aspectos de la datificación, con una amplia dispersión conceptual. La Tabla 1 se estructura en tres grandes bloques que distinguen maneras de acercarse a la sociedad datificada: el primero incluye miradas de carácter epistémico que exploran las continuidades entre los datos, el saber y la sociedad, fijándose en la transformación de la sociedad en una dinámica datocéntrica; el segundo se detiene en las formas en que se gestiona este proceso de integración económica de los datos en la vida política y social, prestando atención a la economía política y a la gobernanza de la sociedad datificada; y el tercero parte de los gestos de confrontación y debate crítico frente a los procesos mayormente corporativos de datificación y explora formas de negociar u oponerse a la datificación en cuanto que cultura de dominación. Mientras estas tres maneras no son completamente excluyentes, sí son funcionalmente útiles para distinguir tres posiciones con respecto a la datificación y para identificar algunos de los autores que han trabajado ya en algunos de los aspectos mencionados.
Epistémicos (sociedad) | Humanistas | Por ejemplo, perspectivas asociando big data y poshumanismo (Chandler, 2015). |
Macrosociales | Sociedad datificada (Hintz et al., 2018); política o cultura datificada (p. ej., Van Es y Schäfer, 2017). | |
Mesosociales | Temporalidad y big data (Lohmeier et al., 2020, Gindin y Busso, 2021); datos y geografía (Thatcher et al., 2018). | |
Microsociales | Datificación del self (por ej., Bode y Kristensen, 2016). | |
Míticometafóricos | Metáforas de big data (Puschmann y Burgess, 2014); visualización de datos (Kennedy y Hill, 2018); representaciones de big data (Pentzold et al., 2019); previsibilidad (Diviani, 2018). | |
Gobernanza (economía política) | Gobernanza | Políticas de comunicación; regulación de Internet (p. ej., Van Eeten y Mueller, 2013); gobernanza por infraestructura (DeNardis y Musiani, 2016); moderación de contenidos, acceso, derechos, políticas de impacto internacional sobre contenidos y copyright (Powell, 2012); gobernanza de plataformas (p. ej., Gillespie, 2017; Smith, 2020). |
Propiedad | Corporaciones, conglomerados, Gafam (p. ej., Muller, 2004, o, más recientemente, Stuart, 2021). | |
Hardware y alcance | Infraestructuras (Ali, 2021); aparatos, tecnologías e interfaces (ver Costanza, 2020), pero también satélites y acceso a datos de geolocalización, cables submarinos y centros de datos, etc. | |
Software y código | Sistemas operativos, plataformas y algoritmos: recomendación, streaming y código, etc. (p. ej., Lessig, 1998, o, más recientemente, Krämer, 2018). | |
Resistencia (activismo) | Vigilancia | Copyright o piratería (ver p. ej., Sarikakis et al., 2017); reconocimiento facial, protección de datos personales (p. ej. en niños, como en Lupton y Williamson, 2017); algorithm washing o discriminación por diseño (p. ej., Clarke, 1988; o Bishop, 2018). |
Hacking | DIY, Data-Literacy, software libre (ver Stallman, 2002); o redes colaborativas, como Guifi.net (ver Baig et al., 2015). | |
Data activismo | EFF (ver p.ej., Nhan y Carroll, 2011); copy-left, Free-software Foundation. | |
Anticolonialismo | Colonialismo de datos (ver también Fraser, 2019); extracción de minerales raros (p. ej., Reading y Notley, 2015); o privatización de infraestructuras, etc. |
Fuente: elaboración propia.
En el caso de las perspectivas incluidas dentro de las miradas epistémicas, están las que discuten la interrelación entre la datificación y la sociedad desde su frente más humano: la cuestión del conductismo, que asume la posibilidad de alterar el comportamiento de las personas gracias a la capacidad de los datos para sugestionar y provocar reacciones; o la posición del poshumanismo -por ejemplo, descrito por Chandler (2015)- que considera el ocaso de lo humano frente a su digitalización. También forman parte de este grupo los debates acerca de la transformación de lo social a nivel macro, que consideran los cambios a escala de toda la sociedad; por ejemplo, los trabajos sobre los Estados de bienestar, de Dencik y Kaun (2020) o sobre democracia, de Chandler y Fuchs (2019); a nivel meso, están las discusiones enfocadas en aspectos que afectan a los grupos, colectivos o dinámicas sociales -el espacio organizativo o las temporalidades-, como las que plantean Lohmeier, Kaun y Pentzold (2020) o Gindin y Busso (2021); y en los ámbitos micro, aquellas investigaciones que atienden a las transformaciones en el nivel de lo individual, incluyendo los mecanismos de medida y registro de datos individuales como formas de identidad, de comprensión de sí mismo y de comportamiento personal, como, por ejemplo, los trabajos sobre la cuantificación del self, de Lupton (2016) o de Nafus (2016).
Por último, se han incluido en este bloque las transformaciones derivadas del análisis y de la comprensión social de la datificación: los mitos fundacionales (Bory, 2020) o existenciales de la sociedad datificada, las metáforas compartidas (Puschmann y Burgess, 2014) o sus representaciones visuales más comunes (Pentzold, Brantner y Foelsche, 2019), o las ideas provocadas por la visualización gráfica de grandes cantidades de datos que alteran nuestra comprensión de la realidad compleja (Kennedy y Hill, 2018) o que justifican sus previsiones (Diviani, 2018).
Entre las miradas incluidas en el bloque de gobernanza y economía política se han distinguido cuatro grupos de trabajos o de debates. Aquellos que se refieren a la gobernanza en general: por ejemplo, gobernanza de internet (Van Eeten y Mueller, 2013), y los que se fijan en la gobernanza por infraestructura (DeNardis y Musiani, 2016) o en los procesos legales globales (Powell, 2012). Aqu í se aborda tanto la regulación sobre acceso a las tecnologías y las medidas de moderación de contenidos en las plataformas digitales y redes sociales (Gillespie, 2017) como los esfuerzos globales, por ejemplo, por controlar el tráfico de propiedad intelectual -ACTA, SOPA/ PIPA (Powell, 2012)-. También se consideran aquellos trabajos que estudian el alcance y papel de las grandes corporaciones propietarias de las plataformas y sus negociaciones frente a los Estados o los conglomerados mediáticos (Muller, 2004; Stuart, 2021); o las investigaciones que se detienen en la infraestructura (el hardware) y los aparatos de la datificación, incluidos los cables submarinos, la justicia del diseño (Costanza, 2020) y los aparatos móviles, el cableado del broadband en las zonas rurales (Ali, 2021), o la lucha geopolítica por el control del 5G. De igual manera, se incorporan en este bloque los trabajos que prestan más atención al código y al programrio (software) (Lessig, 1998), a las interfaces (Scolari, 2015) y a los sistemas operativos y plataformas, en toda su extensión, incluyendo algoritmos, buscadores y sistemas de moderación y de recomendación (Krámer, 2018).
Entre las investigaciones que se sitúan en el bloque de la resistencia, se encuentran aquellas que señalan la datificación como un proceso de dominación. En estos casos, se han distinguido, por ejemplo, vigilancia, hacking, data-activismo y colonialismo de datos. En el primer grupo está la vigilancia -que incluye desde la persecución a ultranza por tráfico de materiales protegidos en Internet hasta las formas de protección y apropiación de datos personales y, en este caso, también la piratería como resistencia (Sarikakis, Krug y Rodriguez-Amat, 2017). Estas formas de vigilancia también incluyen el señalamiento de formas de discriminación por interfaz o por algoritmo (Clarke, 1988; Bishop, 2018). El siguiente es el caso del hacking, referido sobre todo al empoderamiento de los usuarios para que usen y se apropien de las tecnologías responsablemente. También se incluye el activismo de datos, de software libre (Stallmann, 2002) o de infraestructuras (Baig et al., 2015), o también las organizaciones (Nhan y Carroll, 2011). Finalmente, el cuarto tipo se refiere a los esfuerzos para evitar o denunciar las condiciones impuestas por las grandes corporaciones sobre la propiedad, explotación o recolección de datos o de metales raros y recursos naturales (Pitron, 2018; Reading y Notley, 2015), y el anticolonialismo de datos (Fraser, 2019; Couldry y Mejias, 2020), que sitúa la discriminación endémica de la datificación y que, además de extenderse en la geografía y la sociedad, funciona como mecanismo de dominación (Milan y Treré, 2019).
Esta extensa -e inevitablemente insuficiente y esquematizada- literatura sobre la extensión de la conciencia acerca de la datificación en el entorno académico muestra que los datos (en su significado más incierto y amplio: desde el bit informacional hasta el big data) adquieren un valor semiótico, más allá de su propia condición de bits o impulsos eléctricos. Es decir que los datos (incluidos en su formulación genérica como big data) se tienden a considerar desde diferentes perspectivas, pero prácticamente, siempre y en última instancia, al margen de la interpretación que les da sentido (Gitelman y Jackson, 2013). Sabemos que el dato no es algo dado -etimología que nutrió a la palabra data antes de los años cuarenta (Floridi, 2019)- y que, gracias al avance de la digitalización, su concepto es utilizado para describir cualquier pieza de información que pudiera ser almacenada y traducida a código informático (Puschmann y Burgess, 2014a). Por esa misma razón, y por ser fruto de una "traducción a código", los datos no pueden quedarse fuera de los procesos de interpretación, incluso cuando son generados por tecnología. Por el contrario, la producción de los datos es concebida por y para algún sistema (humano o maquinal) que lo puede captar e interpretar al hacerlo circular. Para ello, responden doblemente a restricciones que incluyen las condiciones técnicas de su captura y generación y las condiciones derivadas de su traducción en información y discurso.
Retomando los términos de Latour y su teoría del actor en red (Action Network Theory - ANT) para describir los objetos, podemos decir que los datos son tanto construidos como objetivos, en la medida en que son constructos que responden a criterios tecnológicos y semióticos de producción e interpretación (2005, pp. 76-78, 89-90). Esta idea de objetividad es definitivamente contraria al sentido epistemológicamente banal de carente de perspectiva, opuesto a lo que está producido por el lenguaje, los símbolos y, por lo tanto, pleno de ambigüedad. Los datos, entendidos como huellas significantes, existen en la medida en que son interpretantes de sus condiciones de producción y como signos a ser interpretados en sus condiciones de reconocimiento (Verón, 1988, pp. 132-133). Tal como afirma Jeanneret, "nothing is a trace in absolute terms, the interpretation of marks is based above all on a domain and a questioning that can justify their meaning" (2020, p. 23). Si la misma unidad de información fuera unívocamente interpretada entre su producción y su reconocimiento, carecería de funcionamiento informativo. Es condición primordial que haya transformación y desfase de sentido entre la producción de los datos y su reconocimiento, es decir, circulación. Es en esta dirección que consideramos conveniente retomar los fundamentos de una teoría no lineal del sentido.
Mediatizaciones: tensiones entre datos y sentido
A comienzos de los años noventa, Verón sostenía que estábamos en una transición entre sociedades en vías de mediatización a sociedades mediatizadas, es decir, de sociedades con medios a sociedades que "se transforman en profundidad porque existen los medios" (2004, p. 224). Esta conceptualización no especifica, pero tampoco excluye -más bien lo contrario- el hecho de que los medios han convergido en su digitalización y su conectividad como tendencia generalizada. La actual propuesta de Hepp de la deep mediatization puede verse como un intento interesante de involucrar también estos procesos (2020, p. 40).
Si bien en América Latina el trabajo de Verón se encuentra consolidado, en los últimos años sus desarrollos en torno a la mediatización han despertado interés en circuitos académicos que hasta el momento se mantenían alejados de esta tradición (Lundby, 2014; Averbeck, 2015; Scolari y Rodriguez-Amat, 2018). Su perspectiva resulta fértil para el análisis de la complejidad de los procesos de atribución de significado en los que los datos se ven involucrados.
La teoría social del sentido elaborada por Verón a mitad de los años setenta mostró cómo la producción de sentido, comunicacionalmente hablando, no es calculable de antemano: un mismo mensaje tiene un sentido en relación con sus instancias de producción y otro(s) sentido(s) en sus instancias de consumo o "recepción". A esta diferencia la llamó circulación, siguiendo la denominación marxiana de producción-circulación-consumo.
Aproximadamente en el mismo momento, Stuart Hall también recuperaba ese circuito a propósito de los medios y también comprendía el problema de la circulación no lineal: Hall sostuvo que en la instancia del consumo podía haber lecturas diferentes e inclusive opuestas a las del código implicado en la producción del mensaje (Cingolani, 2020). Sin embargo, la idea de sentido de Hall (1980) era un poco más elemental que la de Verón: por un lado, su esquema encoding/decoding suponía la existencia de un código en común, que podía variar en el momento de la lectura según tres opciones: dominante, oposicional y negociada. Estas tres variaciones funcionaban como un principio a priori, lo que no podría ser de otra manera, de acuerdo con la hipótesis de que un mensaje tiene sentido gracias a un código estable. Solo años más tarde Morley (1996) y Silverstone (1996) comprobaron que esa teoría no se correspondía con lo que encontraban en el terreno de las prácticas culturales; aun así, tampoco ellos elaboraron una teoría del sentido social sistematizada. Sin embargo, mientras que la tradición de los Cultural Studies arraigada en el modelo de Hall ha pervivido en los estudios de comunicación hegemónicos en lengua inglesa -ver, por ejemplo, Sender y Decherney (2016); Shaw (2017) y hasta Meghji (2019)-, la mirada veroniana se ha visto desplazada al sur de los circuitos académicos internacionales (Scolari y Rodriguez-Amat, 2018; Averbeck, 2015).
En cuanto a la noción de código, la crítica temprana desarrollada por Verón (1974; 2004, pp. 27-38) nos libera actualmente para discriminar entre lo que es un protocolo de uso entre computadoras y los procesos (humanos) de producción de sentido. Como se verá más adelante en este texto, a propósito de la datificación, la perspectiva sobre la complejidad del sentido sirve precisamente para descartar la idea de que los datos están sustentados sobre un código de interpretación unívoca. Gracias a ello, ya no es necesario asumir la existencia de un consenso entre comunicantes. Asimismo, para Verón el código está también producido bajo condiciones ideológicas y su fecundidad no solo no se deteriora, sino que depende estrictamente de la dinámica y disparidad de la producción de sentido. Los datos, cada mensaje, cada interfaz, tienen un sentido por su producción y otro(s) diferente(s) en sus recepciones, y entre ambos opera un tercer elemento que los enlaza distanciándolos. Este tercero es la circulación, que exhibe el desfase. La descripción de la producción de sentido como una arquitectura ternaria y en constante transformación permite apreciar que no puede ser determinista en sus efectos y, a su vez, comprender cómo evoluciona y se despliega esta arquitectura como una cadena o red de reenvíos.
La circulación, de acuerdo con Verón, no es el pasaje ni la transmisión, ni la distribución de un mensaje de un lugar (o medio) a otro. El aporte técnico de este concepto es que devela el carácter no unívoco del sentido de un ítem específico (datos, información o discurso), incluso conservando su identidad material. Es decir, la circulación es lo que demuestra que algo puede interpretarse de una manera en su producción y de otra en su o sus instancias de recepción. Esta diferencia es lo que Verón (2004, pp. 39-59) llamó desfase de sentido: en la medida en que el sentido producido para un mensaje no se replica bajo las mismas condiciones de recepción ("reconocimiento"), hay un desfase, que no es ajeno a, sino constitutivo de, lo que llamamos la comunicación.
La apertura interpretativa que genera la teoría de Verón permite vislumbrar la trampa en la que caen tanto los modelos teóricos que creían poder anticipar las interpretaciones (en el caso de Hall), como las teorías según las cuales los algoritmos pueden predecir los efectos de los usuarios. Como sugiere Diviani, este anhelo "se sustenta en uno de los aspectos básicos del dispositivo técnico que despierta gran fascinación: la supuesta facultad de pronosticar los fenómenos futuros. Sin embargo, ¿es posible la predicción de los fenómenos sociales y humanos?" (2018, p. 14).
Lo relevante de esto es la cuestión de la "eficacia" del dato o del mensaje. Un mensaje se percibe como eficaz, para un usuario, cuando el tercer elemento -la circulación- no se hace notar; pero si, en cambio, lo que se intenta es comprender el proceso de funcionamiento de la comunicación científicamente, es necesario desmontar ese proceso ternario y dinámico señalando la actuación interpretativa al articular los datos con su representación.
La molécula de sentido de los datos, de una información, de un mensaje o de una plataforma tiene siempre tres términos (Figura 1). Sin embargo, en las prácticas cotidianas -y en no pocos textos sobre dataficación y big data- se omite la discusión sobre la participación humana en las interpretaciones, como si todo fuera resultado de relaciones binarias producidas por un monstruo suprahumano: "'Big data' is cast as the inevitable consequence of a technological juggernaut with a life of its own entirely outside the social. We are but bystanders" (Zuboff, 2015, p. 75). En este sentido, el efecto de eficacia de los datos se produce a costa de "olvidar" la existencia del sistema interpretante (el sistema que lo produjo, el mecanismo que lo puso ahí).
Por ejemplo, si un "dato" [a] quiere decir que [b] "alguien estuvo en x lugar", esa relación es producida gracias a que [c] ese valor fue asignado dentro de un rango de opciones en el programa que contiene el dato. Olvidar la función de [c] es el éxito que se logra, basado en la confianza que un sistema busca provocar. Cargado con estos valores impensados, ese dato podrá circular así configurado; pero no por ello estará exento de nuevas interpretaciones; es decir, el dato generará los desfases entre la relación [a]-[b]-[c] en el momento [1] y la relación [a]-[b']-[c'] en el momento [2].
Este diagrama (Figura 2) es una reformulación que hacemos de Verón (2019, p. 166) en la que un "emisor" E, en el momento 1, puede enviar o producir un dato [a] que comprende una representación [b], de acuerdo con un modo de interpretarlo [c], que luego el "receptor" R, en el momento 2, podrá recuperar como el "mismo" dato, el cual, sin embargo, representará algo [b']. No es posible saber en qué medida [b'] coincide con [b], ya que tampoco se puede calcular con precisión si la interpretación [c'] es para R la misma que la [c] para E.
Datificación y desfases
La datificación, de acuerdo con Hepp, puede ser entendida como la representación de la vida social a través de un conjunto de datos computarizados (2020, p. 40). Como todo proceso de representación de la vida social, la datificación se encuentra afectada de desfases de sentido necesarios (es decir, irreductibles), al menos en tres instancias. El primer desfase de sentido es la tensión que se produce al traducir los bits en datos y posteriormente creer que muchos bits son información (o big data). El segundo es el paso del nivel profundo al superficial, es decir, de la transformación del big data en mensajes o discursos que se ponen en circulación en lo social en forma de historias. El tercer desfase consiste en que esos discursos son a su vez interpretados y utilizados de formas diversas por los actores sociales. Un riesgo (a menudo inadvertido) es que se tomen esos desfases por sistemas de códigos unívocos, evitando con ello el actual proceso que exige que se estudie la producción de sentido en cada una de esas diferentes instancias.
Las ciencias que estudian el sentido tienen la función y la capacidad de desentrañar aquello que aparece como opaco, esos atajos inadvertidos. Las metáforas con las que se nombra, por ejemplo, el almacenamiento de los datos (la nube o el lago), la recolección de datos personales como "recursos naturales" o el big data -como una fuerza natural a controlar o un alimento o combustible que debe ser consumido, por mencionar algunas metáforas (Puschmann y Burgess, 2014b)-, no hacen más que ocultar aquello que aquí estamos señalando. No podemos dejar de lado que, en todos sus niveles, los datos son recolectados según diversos criterios -nunca neutrales o despojados de interés (Manovich, 2001, p. 224; Gitelman yJackson, 2013, p. 3.)- y después son puestos en relación e interpretados. Es justamente en esas operaciones donde el dispositivo teórico de Verón que hemos retomado antes abre nuevas vías para la comprensión de estos fenómenos desde una perspectiva que empieza por no asumir que el recorrido de los datos sea lineal, ni compacto, ni unívoco.
La insistencia en la opacidad de estos procesos se debe a que los patrones mediante los cuales se establecen los criterios de búsqueda de información y los criterios de posterior puesta en relación son desconocidos para el lego. Como señalan Mejias y Couldry "los datos no se extraen de nosotros automáticamente, sino a través de relaciones sociales a las que en algún momento, aunque retrospectivamente, se supone que hemos dado consentimiento" (2019, p. 89).
Un rápido ejemplo nos servirá como excusa para poner a trabajar la idea de autoridad interpretativa y su vínculo con lo desarrollado hasta el momento. En abril del 2020 un ciudadano argentino publicó un tuit en el que realizaba una humorada sobre la situación económica del país y la posibilidad de realizar un acto delictivo (un "saqueo"). El tuit fue inmediatamente interpretado por el Estado nacional como un "peligro" y considerado como un delito de intimidación pública y, mediante el rastreo de datos, el usuario de la cuenta fue imputado. La cuestión en torno a la autoridad interpretativa que mencionamos supra cobra sentido en la incapacidad de distinguir la diferencia entre producción y reconocimiento de dicho tuit. El aparato estatal se sobreactuó en una cadena de interpretaciones que perdió de vista el propósito inicial (o la gravedad fundamental) de la publicación del tuit. Esto nos ayuda a reflexionar sobre la dimensión sociosemiótica implicada en el dispositivo legal y tecnológico utilizado en las políticas estatales y comerciales de la producción y el uso de datos (O'Neill, 2016). Cualquiera que sea la utilización más o menos tecnológica de la producción y recepción de mensajes, siempre estará afectada de desfase. Los algoritmos que se proponen y diseñan para anticipar posibles efectos en quienes utilizan, interpretan o consumen los discursos circulantes (en redes, por ejemplo) -haciendo cálculos y aplicando pautas que funcionan como previsiones, pero precisamente por el espacio incierto que separa la producción y el reconocimiento (la circulación) que cargan el dato-, no serán capaces de anticipar -o reconocer- los efectos.
Volviendo al ejemplo: el entrecruzamiento de datos que permitió que, de manera inmediata, el Estado argentino identificara el tuit y al sujeto que lo publicó lo construyó como autoridad interpretativa, como posición autorizada para decidir cuáles, de los millones de datos que circulan en las redes sociales, se reconocen como peligrosos para el orden social. Por otro lado, este ejemplo pone de relieve una cadena de actores intervinientes como intérpretes en estos procesos: el Estado y todo su aparato judicial, policial, etc., pero también las plataformas, los algoritmos y sus respectivas capacidades técnicas e interpretativas de atribuir valor moral-social a esos datos -distinguiéndolos de esos otros que no lo tienen-. Dicha cadena de capacidades y empoderamientos no es estrictamente nueva, pero sí se hace evidente que este particular entramado de interpretación toma las formas de gestión, identificación y acusación.
La decisión del "viraje hacia los datos" entra en tensión no solamente con los tipos de datos que se recolectan, sino, fundamentalmente, con las formas (y los lugares) en los que estos se interpretan. ¿Con qué criterio se define su peligrosidad? Tal como afirman Dencik y Kaun, "data, on this premise, needs to be collected in as large a quantity as possible (total information capture), processed through automation, with the view to calculate all possible outcomes -a knowing of all risks- so as to preempt them before they occur" ' (2020, s.p.).
Se visibiliza, entonces, un desplazamiento entre una concepción de los datos como una entidad neutral -electrónica- y otra como testigo, como registro y como prueba de valor judicial que amenaza un cierto orden legal. Los datos (esa unidad de medida informacional que parece suplantar a los bits) se dispersan en tres momentos interpretativos en los que esos datos se han convertido en discursos y aparatos de significación.
A modo de recapitulación
Este trabajo se propuso considerar críticamente el problema que surge de las perspectivas que desatienden la conexión entre los procedimientos tecnológicos para producir datos y los discursos que los interpretan, mostrando cómo esta conexión en realidad está sentada en un punto de indeterminación casi schrõdingeriana, habitualmente asumida de manera acrítica. Ahí es, precisamente, donde este artículo procura contribuir a las corrientes y relevantes discusiones sobre big data y sus implicaciones sociales, a fin de enriquecer esos debates que se fijan en la propiedad de los datos, su extracción, su resguardo, los mecanismos de su almacenamiento y todos los procesos intermedios humanos o algoritmos que califican y combinan los datos por su valor y los sentidos que los atraviesan.
Para erosionar las dinámicas globales de discriminación de los discursos sobre big data y sus implicaciones sociales y políticas, es necesario empezar por las ciencias sociales. Teorías bienintencionadas sobre la cultura han revalorizado la importancia de las lecturas contrahegemónicas, pero lo han hecho sobre la base de determinismos estructurales, con principios que no tenían al desfase de sentido entre sus herramientas descriptivas. Alentar un falso objetivismo o linealismo comunicacional o reproducir modelos reconocidos por tradiciones de conocimiento hegemónicas frente a otras oportunidades descriptivas son factores que -más que resistir-contribuyen al colonialismo digital.
En este trabajo hemos avanzado en la pregunta por la interpretación de los datos, incorporando a la discusión la teoría sobre el sentido elaborada por Eliseo Verón. Hemos ejemplificado, por su parte, con un caso que tuvo lugar en Argentina y hemos puesto en discusión la cuestión en torno a la autoridad interpretativa, esto es, quién/es y de qué modo definen un contenido datificado como peligroso o amenazante.
La oportunidad de tratar los datos como discurso e identificar en ellos las huellas de su producción, de su circulación y de su reconocimiento es un punto de partida para trabajos posteriores que desarrollen modelos de los procesos en los que los datos toman parte. De igual modo, el artículo provee herramientas conceptuales para tratar críticamente tanto los procesos de la interpretación mecánica hecha por algoritmos como las operaciones de reducción e imposición de interpretaciones en manos de autoridades interpretativas. Es, asimismo, una oportunidad para aplicar esta perspectiva como estrategia para el análisis de casos específicos.
Pero, además, este primer paso puede ayudar en los debates y trabajos académicos que se preocupan por las implicaciones sociales y políticas del big data, como mínimo en las tres líneas que describimos previamente: las reflexiones de carácter epistémico que intentan comprender la datificación de la sociedad, las que exploran las cuestiones de economía política y gobernanza de la datificación y aquellas que resisten frente a unas racionalidades de dominación agazapadas detrás de unos datos que se esfuerzan en ocultar que son discursos.