Conferencia de Directores y Decanos de Ingeniería Informática

Mensajes etiquetados Ricardo Baeza-Yates

Entrevista a Ricardo Baeza-Yates, Premio Nacional de Informática

Ricardo Baeza-Yanes, premio nacional de Informática (El País)

La sabiduría de las masas es falsa porque la gente activa en la Red es una minoría, según explica el experto.

Todo lo que hay en Internet es obra de unos pocos. Unos «pocos» que son decenas de millones de personas, pero que solo representan un porcentaje pequeño del total de usuarios. La web es un océano infinito que cubre toda la Tierra, pero la gente que la alimenta cabría en una isla.

Menos del 1% de usuarios de Internet crea más del 50% del contenido. «Si tomas cualquier segmento de tiempo determinado, el porcentaje de gente activa en Internet seguro que es menos del 10%», explica el profesor chileno Ricardo Baeza-Yates. «Lo he visto en lugares donde he trabajado. La mayor parte de gente en internet, en las redes sociales sobre todo, está de mirón, sin hacer nada. Ni siquiera hace un like. No genera datos para internet, que no es lo mismo que estar activo. La gente que contribuye, que hace un like, podría ser un 10%, pero quienes hacen un tuit o un post o cuelgan una foto, van a ser menos», añade.

En distintos trabajos, Baeza-Yates ha encontrado que un 4% de los usuarios activos escribe las reseñas en Amazon («y eso que un mes después de publicar el artículo Amazon empezó a perseguir las reseñas pagadas, con lo que el número real es menor»), un 2% de usuarios escribe la mitad de tuits en Twitter y que la primera versión de la mitad de entradas de la Wikipedia en inglés fue creada por un 0,04% de sus usuarios registrados, unas 2.000 personas. «Y fue porque les pagaron, porque quién participa en algo que está vacío», dice Baeza-Yates.

En internet también funciona una ley humana que la sabiduría popular española conoce bien: uno hace, muchos miran. «Es el sesgo de actividad: pocos trabajan y muchos no hacen nada. En cualquier actividad humana, se ve este sesgo. Pocos tiran, los otros siguen», explica Baeza. Es un fenómeno tan establecido que tiene un nombre: la ley de Zipf.

«La consecuencia más importante de este fenómeno es que la sabiduría de masas es una ilusión», dice Baeza-Yates en una conversación con EL PAÍS en Madrid, donde acudió para participar en la inauguración de la sede de la factoría de inteligencia artificial del BBVA. Baeza-Yates es también premio Nacional de Informática en investigación industrial y transferencia tecnológica 2018, director de programas de posgrado en ciencia de datos en el campus de Silicon Valley de la Northeastern University, catedrático de la Universitat Pompeu Fabra y jefe de tecnología de NTENT, una compañía de búsquedas en Silicon Valley, donde vive.

La sabia masa de internet no es por tanto todos los humanos que usan la red, sino quienes generan contenido. «Es la sabiduría de la gente que está haciendo cosas. Si hay grupos que quieren manipular en Twitter en Estados Unidos, en Facebook en Filipinas o WhatsApp en Brasil tienen mucha potencia porque hay muchos que no hacen nada, que solo miran», explica.

Baeza-Yates cree que un rasgo a menudo común de los usuarios más activos es que son «los malos», como en los casos de Filipinas, Brasil o Estados Unidos. «La gente que quiere manipular es más activa que la que no quiere manipular», dice, «por una razón sencilla: la gente que quiere manipular tiene un objetivo y por tanto una motivación para actuar, mientras que la mayoría de la gente no tiene ni siquiera la motivación para participar». Las ganas de fastidiar son un incentivo maravilloso en un mundo donde la mayoría solo se asoma.

Estos hallazgos forman parte de una larga investigación de Baeza-Yates sobre los sesgos en la web. Como el ya canal principal de comunicación humana, los sesgos que produce internet están destinados a marcar muchas de nuestras decisiones futuras. Los pocos usuarios activos son un sesgo habitual que tenemos cuando creemos que lo que leemos en Twitter es lo que «cree la gente». Es el sesgo de actividad. Pero hay más.

La profundidad de internet

¿Qué hay en el fondo de internet? La sensación real de que en internet está todo no sirve para las cosas que no sabemos que existen. ¿Cómo sabe Netflix que una película no gusta si ni siquiera la ha enseñado a un grupo suficiente de usuarios para que decidan si quieren verla? Algo parecido pasa con los resultados de las búsquedas, más ahora cuando Google intenta que los usuarios no abandonen su página para ver lo que buscan. ¿Quién se molesta en ir a mirar el resultado 35 de una búsqueda? Una página puede subir en los resultados gracias a enlaces y otros criterios, pero la competición es cada vez mayor.

«Este sesgo de presentación o exposición es el más grave. Es imposible enseñar todo a todo el mundo para que decida», dice Baeza-Yates. Y tampoco es trivial calcularlo: ¿a quién se enseña lo que nadie ve? Por ejemplo, una película polaca en Netflix. Si se le muestra aleatoriamente a un 5% de los usuarios norteamericanos, ¿son esos representativos para luego enseñarla a más? «¿Y por qué en ese caso solo un 5%?», se pregunta Baeza-Yates. «Porque pierdo dinero», responde. Si Facebook se arriesga a enseñar más de un 5% de los posts que nadie presuntamente quiere ver, se arriesga a que los usuarios tengan menos interés y acaben viendo menos anuncios en los que clicar.

La larga cola de internet, donde cada cual tenía lo que quería porque colgar un libro o una película era casi gratis, se ha convertido en el «desierto digital». «La web se ha hecho casi infinita y ha crecido mucho más rápido que el número de personas conectadas a Internet», dice Baeza-Yates. En un artículo de 2015, intentó encontrar umbrales aproximados de ese desierto. Un 1,1% de los tuits son escritos por gente sin seguidores, decía Baeza-Yates, y un 31% de los artículos de la Wikipedia modificados en mayo de 2014 nunca fueron visitados en junio. «El tamaño de ese desierto digital probablemente esté en la parte baja de esa franja 1%-31%», dice Baeza-Yates. Y creciente.

Autor: Jordi Pérez Colomé

Fuente: EL PAÍS